1、第六章 数据库设计习题解答和解析1. 1. 试述数据库设计过程。答:这里只概要列出数据库设计过程的六个阶段:(1)需求分析;(2)概念结构设计;(3)逻辑结构设计;(4)数据库物理设计;(5)数据库实施;(6)数据库运行和维护。这是一个完整的实际数据库及其应用系统的设计过程。不仅包括设计数据库本身,还包括数据库的实施、运行和维护。设计一个完善的数据库应用系统往往是上述六个阶段的不断反复。解析:希望读者能够认真阅读概论6.1 的内容,了解并掌握数据库设计过程。2. 2. 试述数据库设计过程各个阶段上的设计描述。答:各阶段的设计要点如下:(1)需求分析:准确了解与分析用户需求(包括数据与处理)。(
2、2)概念结构设计:通过对用户需求进行综合、归纳与抽象,形成一个独立于具体DBMS 的概念模型。(3)逻辑结构设计:将概念结构转换为某个 DBMS 所支持的数据模型,并对其进行优化。(4)数据库物理设计:为逻辑数据模型选取一个最适合应用环境的物理结构(包括存储结构和存取方法)。(5)数据库实施:设计人员运用 DBMS 提供的数据语言、工具及宿主语言,根据逻辑设计和物理设计的结果建立数据库,编制与调试应用程序,组织数据入库,并进行试运行。(6)数据库运行和维护:在数据库系统运行过程中对其进行评价、调整与修改。解析:这是进一步了解数据库设计的具体内容。设计描述是指在各个阶段体现设 计内容,描述设计结
3、果的各种文档、程序。读者可以参考概论上图 6.3。3. 3. 试述数据库设计过程中结构设计部分形成的数据库模式。答:数据库结构设计的不同阶段形成数据库的各级模式,即:(1)在概念设计阶段形成独立于机器特点,独立于各个 DBMS 产品的概念模式,在本篇中就是 E-R 图;(2)在逻辑设计阶段将 E-R 图转换成具体的数据库产品支持的数据模型,如关系模型,形成数据库逻辑模式,然后在基本表的基础上再建立必要的视图(View),形成数据的外模式;(3)在物理设计阶段,根据 DBMS 特点和处理的需要,进行物理存储安排,建立索引,形成数据库内模式。读者可以参考概论上图 6.4。图中概念模式是面向用户和设
4、计人员的,属于概念模型的层次;逻辑模式、外模式、内模式是 DBMS 支持的模式,属于数据模型的层次,可以在DBMS 中加以描述和存储。4. 4. 试述数据库设计的特点。答:数据库设计既是一项涉及多学科的综合性技术又是一项庞大的工程项目。其主要特点有:(1)数据库建设是硬件、软件和干件(技术与管理的界面)的结合。(2)从软件设计的技术角度看,数据库设计应该和应用系统设计相结合,也就是说,整个设计过程中要把结构(数据)设计和行为(处理)设计密切结合起来。 详细的可以参考概论上 6.1.2。5. 5. 需求分析阶段的设计目标是什么?调查的内容是什么?答:需求分析阶段的设计目标是通过详细调查现实世界要
5、处理的对象(组织、部 门、企业等),充分了解原系统(手工系统或计算机系统)工作概况,明确用户的各种需求,然后在此基础上确定新系统的功能。调查的内容是“数据“和“处理“,即获得用户对数据库的如下要求:(1)信息要求,指用户需要从数据库中获得信息的内容与性质,由信息要求可以导出数据要求,即在数据库中需要存储哪些数据;(2)处理要求,指用户要完成什么处理功能,对处理的响应时间有什么要求,处理方式是批处理还是联机处理;(3)安全性与完整性要求。详细的可以参考概论上 6.2。6. 6. 数据字典的内容和作用是什么?答:数据字典是系统中各类数据描述的集合。数据字典的内容通常包括:(1)数据项;(2)数据结
6、构;(3)数据流;(4)数据存储;(5)处理过程五个部分。其中数据项是数据的最小组成单位,若干个数据项可以组成一个数据结构。数据字典通过对数据项和数据结构的定义来描述数据流和数据存储的逻辑内容。数据字典的作用:数据字典是关于数据库中数据的描述,在需求分析阶段建立,是下一步进行概念设计的基础,并在数据库设计过程中不断修改、充实、完善。(详细参考概论上 6.2.3。注意,数据库设计阶段形成的数据字典与第十一章 DBMS 中的数据字典不同,后者是 DBMS 关于数据库中数据的描述,当然两者是有联系的)。7. 7. 什么是数据库的概念结构?试述其特点和设计策略。答:概念结构是信息世界的结构,即概念模型
7、,其主要特点是:(1)能真实、充分地反映现实世界,包括事物和事物之间的联系,能满足用户对数据的处理要求,是对现实世界的一个真实模型;(2)易于理解,从而可以用它和不熟悉计算机的用户交换意见,用户的积极参与是数据库设计成功的关键;(3)易于更改,当应用环境和应用要求改变时,容易对概念模型修改和扩充;(4)易于向关系、网状、层次等各种数据模型转换。概念结构的设计策略通常有四种:l)自顶向下,即首先定义全局概念结构的框架,然后逐步细化;2)自底向上,即首先定义各局部应用的概念结构,然后将它们集成起来,得到全局概念结构;3)逐步扩张,首先定义最重要的核心概念结构,然后向外扩充,以滚雪球的方式逐步生成其
8、他概念结构,直至总体概念结构;4)混合策略,即将自顶向下和自底向上相结合,用自顶向下策略设计一个全局概念结构的框架,以它为骨架集成由自底向上策略中设计的各局部概念结构。详细参考概论上6.3。8. 8. 什么叫数据抽象?试举例说明。答:数据抽象是对实际的人、物、事和概念进行人为处理,抽取所关心的共同特性,忽略非本质的细节,并把这些特性用各种概念精确地加以描述,这些概念组成了某种模型。如“分类“这种抽象是:定义某一类概念作为现实世界中一组对象的类型。这些对象具有某些共同的特性和行为。它抽象了对象值和型之间的“is member of“ 的语义。在 E-R 模型中,实体型就是这种抽象。例如在学校环境
9、中,李英是老师,表示李英是教师类型中的一员,则教师是实体型,李英是教师实体型中的一个实体值,具有教师共同的特性和行为:在某个系某个专业教学,讲授某些课程,从事某个方向的科研。9. 9. 试述数据库概念结构设计的重要性和设计步骤。答:重要性:数据库概念设计是整个数据库设计的关键,将在需求分析阶段所得到的应用需求首先抽象为概念结构,以此作为各种数据模型的共同基础,从而能更好地、更准确地用某一 DBMS实现这些需求。设计步骤:概念结构的设计方法有多种,其中最经常采用的策略是自底向上方法,该方法的设计步骤通常分为两步:第 1 步是抽象数据并设计局部视图,第 2 步是集成局部视图,得到全局的概念结构(如
10、概论图 6.9 所示)。10.什么是 E-R 图?构成 E-R 图的基本要素是什么?答:E-R 图为实体-联系图,提供了表示实体型、属性和联系的方法,用来描述现实世界的概念模型。构成 E-R 图的基本要素是实体型、属性和联系,其表示方法为:(1)实体型,用矩形表示,矩形框内写明实体名;(2)属性,用椭圆形表示,并用无向边将其与相应的实体连接起来;(3)联系,用菱形表示,菱形框内写明联系名,并用无向边分别与有关实体连接起来,同时在无向边旁标上联系的类型(1:1,1:n 或 m:n)。解析:E-R 图的概念是在第一章中讲解的,读者可以复习概论1.2.2 概念模型的 内容。11.为什么要视图集成?视
11、图集成的方法是什么?答:在对数据库系统进行概念结构设计时一般采用自底向上的设计方法,把繁杂的大系统分解子系统。首先设计各个子系统的局部视图,然后通过视图集成的方式将各子系统有机地融合起来,综合成一个系统的总视图。这样,设计清晰,由简到繁。由于数据库系统是从整体角度看待和描述数据的,因此数据不再面向某个应用而是整个系统。因此必须进行视图集成,使得数据库能被全系统的多个用户、多个应用共享使用。一般说来,视图集成可以有两种方式:(1)多个分 E-R 图一次集成,如概论图 6.25(a)所示;(2)逐步集成,用累加的方式一次集成两个分 E-R 图,如概论图 6.25(b)所示。无论采用哪种方式,每次集
12、成局部 E-R 图时都需要分两步走: 合并 ,解决各分 E-R 图之间的冲突,将各分 E-R 图合并起来生成初步 E-R 图; 修改和重构 ,消除不必要的冗余 ,生成基本 E-R 图。12.什么是数据库的逻辑结构设计?试述其设计步骤。答:数据库的逻辑结构设计就是把概念结构设计阶段设计好的基本 E-R 图转换为与选用的 DBMS 产品所支持的数据模型相符合的逻辑结构。设计步骤为(概论图 6.31):(1)将概念结构转换为一般的关系、网状、层次模型;(2)将转换来的关系、网状、层次模型向特定 DBMS 支持下的数据模型转换;(3)对数据模型进行优化。13.试述把 E-R 图转换为 DBTG 模型和
13、关系模型的转换规则。答:E-R 图向 DBTG 模型的转换规则:(1)每个实体型转换为记录型,实体的属性转换为记录的数据项;(2)实体型之间 1:n(n1)的联系转换为一个系,没有任何联系的实体型转换为奇异系;(3)K(K 2)个实体型之间多对多的联系,引入一个连结记录,形成 K 个实体型和连结记录之间的 K 个系。连结记录的属性由诸首记录的码及联系属性所组成;(4)同一实体型内的 1:n,n:m 联系,引入连结记录,转换为两个系。解析:根据我国实际情况,网状,层次数据库系统已很少使用,因此概论第三版 把它们删去了,有关的主要概念放在第一章数据模型中介绍。对于 DBTG 模型的许多概念也介绍得
14、很简单。本题的内容已经超出了书上的内容,读者只要了解就可以了。但是,下面 E-R图向关系模型的转换规则要求同学必须掌握,并且能够举一反三。答:E-R 图向关系模型的转换规则:一个实体型转换为一个关系模式。实体的属性就是关系的属性,实体的码就是关系的码。对于实体间的联系则有以下不同的情况:(1)一个 1:1 联系可以转换为一个独立的关系模式,也可以与任意一端对应的关系模式合并。如果转换为一个独立的关系模式,则与该联系相连的各实体的码以及联系本身的属性均转换为关系的属性,每个实体的码均是该关系的候选码。如果与某一端实体对应的关系模式合并,则需要在该关系模式的属性中加入另一个关系模式的码和联系本身的
15、属性。(2)一个 1:n 联系可以转换为一个独立的关系模式,也可以与 n 端对应的关系模式合并。如果转换为一个独立的关系摸式,则与该联系相连的各实体的码以及联系本身的属性均转换为关系的属性,而关系的码为 n 端实体的码。(3)一个 m:n 联系转换为一个关系模式。与该联系相连的各实体的码以及联系本身的属性均转换为关系的属性,各实体码的组合组成该关系的码,或码的一部分。(4)3 个或 3 个以上实体间的一个多元联系可以转换为一个关系模式。与该多元联系相连的各实体的码以及联系本身的属性均转换为关系的属性,而关系的码为各实体码的组合。(5)具有相同码的关系模式可以合并。14.你能给出由 E-R 图转
16、换为 IMS 模型的转换规则吗?答:E-R 图向 IMS 模型的转换规则:(1)每个实体型转换为记录型,实体的属性转换为记录的数据项;(2)实体型之间 1:n(n1)的联系转换记录型之间的有向边;(3)实体型之间 m:n(m1,n1)的联系则分解成一对多联系,再根据(2)转换;(4)K(K 2)个实体型之间多对多的联系,可先转换成多对两个实体型之间的联系,再根据(3)转换。解析:IMS 是 IBM 公司的层次数据库管理系统。IMS 模型是层次模型。E-R 图向 IMS 模型转换的另一种方法是,先把 E-R 图转换为网状模型,再利用 IMS 逻辑数据库 LDB 的概念来表示网状模型。详细方法这里
17、从略。15.试把第一章习题 12 和习题 13 中的 E-R 图转换为 DBTG 模型、IMS 模型、关系模型。答:下面是第一章习题 12 的 E-R 图 :各实体的属性为:(简便起见,未用图表示)系:系编号,系名班级:班级编号,班级名教研室:教研室编号,教研室学生:学号,姓名,学历课程:课程编号,课程名教员:职工号,姓名,职称各联系的属性为:选修课:成绩其他联系无属性。该 E-R 图的 DBTG 模型如下页所示其关系模型为:系(系编号,系名,学校名)班级(班级编号,班级名,系编号)教研室(教研室编号,教研室,系编号)学生(学号,姓名,学历,班级编号,导师职工号)课程(课程编号,课程名)教员(
18、职工号,姓名,职称,教研室编号)选课(学号,课程编号,成绩)习题 13 的 E-R 图:各实体的属性为:(方便起见,未用图表示)产品:产品号,产品名零件:零件号,零件名原材料:原材料号,原材料名,类别仓库:合库号,仓库名各联系的属性为:产品组成:使用零件量零件制造:使用原材料量零件存储:存储量材料存放:存放量其 DBTG 模型如下页图所示。对应的 IMS 模型从略。对应的关系模型为(其中有下横线的属性是主码属性):产品(产品号,产品名,仓库号)零件(零件号,零件名)原材料(原材料号,原材料名,类别,仓库号,存放量)仓库(仓库号,仓库名)产品组成(产品号,零件号,使用零件量)零件组成(零件号,原
19、材料号,使用原材料量)零件储存(零件号,仓库号,存储量)16.试述逻辑设计阶段中运用 LRA 方法优化模型的方法和步骤。答:(从略,此题不作要求)17.试用规范化理论中有关范式的概念分析习题 15 中你设计的关系模型中各个关系模式的码,它们属于第几范式?会产生什么更新异常?答:习题 15 中设计的两个关系数据库的各个关系模式的码都用下划线注明,这些关系模式都只有一个码,且都是惟一决定的因素,所以都属于 BCNF。不会产生更新异常现象。18.规范化理论对数据库设计有什么指导意义?答:规范化理论为数据库设计人员判断关系模式的优劣提供了理论标准,可用以指导关系数据模型的优化,用来预测模式可能出现的问
20、题,为设计人员提供了自动产生各种模式的算法工具,使数据库设计工作有了严格的理论基础(可参考概论上数据模型的优化)。19.试述数据库物理设计的内容和步骤。答:数据库在物理设备上的存储结构与存取方法称为数据库的物理结构,它依赖于给定的 DBMS。为一个给定的逻辑数据模型选取一个最适合应用要求的物理结构,就是数据库的物理设计的主要内容。数据库的物理设计步骤通常分为两步:(1)确定数据库的物理结构,在关系数据库中主要指存取方法和存储结构;(2)对物理结构进行评价,评价的重点是时间效率和空间效率。详细参考概论上6.5.10。20.你能给出关系数据库物理设计的主要内容吗?例如 Oracle 数据库物理设计
21、的内容。答:关系数据库物理设计的内容主要包括:(1)为关系模式选择存取方法;(2)设计关系、索引等数据库文件的物理存储结构。详细参考概论上 6.5.2 和 6.5.3。有关 Oracle 数据库物理设计的内容请参考其技术资料,根据上述内容进行总结。21.数据输入在实施阶段的重要性是什么?如何保证输入数据的正确性?答:数据库是用来对数据进行存储、管理与应用的,因此在实施阶段必须将原有 系统中的历史数据输入到数据库。数据量一般都很大,而且数据来源于部门中的各个不同的单位。数据的组织方式、结构和格式都与新设计的数据库系统有相当的差距,组织数据录人就要将各类源数据从各个局部应用中抽取出来,分类转换,最
22、后综合成符合新设计的数据库结构的形式,输入数据库。因此这样的数据转换、组织入库的工作是相当费力费时的工作。特别是原系统是手工数据处理系统时,各类数据分散在各种不同的原始表格、凭证、单据之中,数据输入工作量更大。 保证输入数据正确性的方法:为提高数据输入工作的效率和质量,应该针对具体的应用环境设计一个数据录入子系统,由计算机来完成数据入库的任务。 在源数据入库之前要采用多种方法对它们进行检验,以防止不正确的数据入库。详细参考概论上 6.6.1。22.什么是数据库的再组织和重构造?为什么要进行数据库的再组织和重构造?答:数据库的再组织是指:按原设计要求重新安排存储位置、回收垃圾、减少指针链等,以提
23、高系统性能。数据库的重构造则是指部分修改数据库的模式和内模式,即修改原设计的逻辑和物理结构。数据库的再组织是不修改数据库的模式和内模式的。进行数据库的再组织和重构造的原因:数据库运行一段时间后,由于记录不断增、删、改,会使数据库的物理存储情况变坏,降低了数据的存取效率,数据库性能下降,这时 DBA 就要对数据库进行重组织。DBMS 一般都提供用于数据重组织的实用程序。数据库应用环境常常发生变化,如增加新的应用或新的实体,取消了某些应用,有的实体与实体间的联系也发生了变化等,使原有的数据库设计不能满足新 的需求,需要调整数据库的模式和内模式。这就要进行数据库重构造。23.现有一局部应用,包括两个
24、实体:“出版社“和“作者“,这两个实体是多对多的联系,请读者自己设计适当的属性,画出 E-R 图,再将其转换为关系模型(包括关系名、属性名、码和完整性约束条件)。答:E-R 图为:关系模型为:作者(作者号,姓名,年龄,性别,电话,地址)出版社(出版社号,名称,地址,联系电话)出版(作者号,出版社号,书的数量)出版关系的主码作者号,出版社号分别参照作者关系的主码作者号和出版 社关系的主码出版社号。24.请设计一个图书馆数据库,此数据库中对每个借阅者保存读者记录,包括:读者号,姓名,地址,性别,年龄,单位。对每本书存有:书号,书名,作者,出版 社。对每本被借出的书存有读者号、借出日期和应还日期。要
25、求:给出 E-R 图,再将其转换为关系模型。答:E-R 图为:关系模型为:读者(读者号,姓名,地址,性别,年龄,单位)书(书号,书名,作者,出版社)借书(读者号,书号,借出日期,应还日期)大作业完成一个实际部门的数据库应用系统设计全过程。包括:需求调查、数据库设计、数据库建立、数据输入、应用系统设计和开发、用户界面的设计和实现等。要求:1.人员:5-6 人。2.分工:每个人担任不同的角色,包括系统分析人员、系统设计人员、数据库设计人员、应用系统开发人员、测试人员等。分工协作,共同完成设计和开发任务,从而培养团队精神。3.选择一个合适的 DBMS 产品或者使用学校提供的 DBMS 产品,选择合适的应用开发工具,按照设计的结果建立数据库、开发应用系统、输入数据、调试运行你们的系统。4.要求写出完整的实验报告,包括:需求调查报告、系统分析报告、数据库设计报告、应用系统设计报告、数据库实施计划、系统测试计划、系统测试报告、用户使用手册等文档。5.向老师和其他小组运行演示开发的数据库应用系统,提交所有文档。6.集体讨论、互相学习,指出各自的特点和不足,交流开发过程中的收获和 体会。