1、(2003/9/21 ) (GJ-DA ) (共 2 页) 目录-1 第 1 章 数据库概论 1.1 基本内容分析 1.1.1 本章的重要概念 (1)DB、DBMS 和 DBS 的定义 (2)数据管理技术的发展阶段 人工管理阶段、文件系统阶段、数据库系统阶段和高级数据库技术阶段等各阶段的特点。 (3)数据描述 概念设计、逻辑设计和物理设计等各阶段中数据描述的术语,概念设计中实体间二元联 系的描述(1:1,1:N,M:N) 。 (4)数据模型 数据模型的定义,两类数据模型,逻辑模型的形式定义,ER 模型,层次模型、网状模 型、关系模型和面向对象模型的数据结构以及联系的实现方式。 (5)DB 的体
2、系结构 三级结构,两级映像,两级数据独立性,体系结构各个层次中记录的联系。 (6)DBMS DBMS 的工作模式、主要功能和模块组成。 (7)DBS DBS 的组成,DBA,DBS 的全局结构,DBS 结构的分类。 1.1.2 本章的重点篇幅 (1)教材 P23 的图 1.24(四种逻辑数据模型的比较) 。 (2)教材 P25 的图 1.27( DB 的体系结构) 。 (3)教材 P28 的图 1.29( DBMS 的工作模式) 。 (4)教材 P33 的图 1.31( DBS 的全局结构) 。 1.2 教材中习题 1 的解答 1.1 名词解释 逻辑数据:指程序员或用户用以操作的数据形式。 物
3、理数据:指存储设备上存储的数据。 联系的元数:与一个联系有关的实体集个数,称为联系的元数。 1:1 联系:如果实体集 E1 中每个实体至多和实体集 E2 中的一个实体有联系,反之亦 然,那么 E1 和 E2 的联系称为“1:1 联系” 。 1:N 联系:如果实体集 E1 中每个实体可以与实体集 E2 中任意个(零个或多个)实体 有联系,而 E2 中每个实体至多和 E1 中一个实体有联系,那么 E1 和 E2 的联系是“1:N 联 系” 。 M:N 联系:如果实体集 E1 中每个实体可以与实体集 E2 中任意个(零个或多个)实体 有联系,反之亦然,那么 E1 和 E2 的联系称为“M:N 联系”
4、 。 数据模型:能表示实体类型及实体间联系的模型称为“数据模型” 。 概念数据模型:独立于计算机系统、完全不涉及信息在计算机中的表示、反映企业组 织所关心的信息结构的数据模型。 结构数据模型(或逻辑数据模型):与 DBMS 有关的,直接面向 DB 的逻辑结构、从 计算机观点对数据建模的数据模型。 层次模型:用树型(层次)结构表示实体类型及实体间联系的数据模型称为层次模型。 (2003/9/21 ) (GJ-DA ) (共 2 页) 目录-2 网状模型:用有向图结构表示实体类型及实体间联系的数据模型称为网状模型。 关系模型:用二维表格表达实体集的数据模型。 外模式:是用户用到的那部分数据的描述。
5、 概念模式:数据库中全部数据的整体逻辑结构的描述。 内模式:DB 在物理存储方面的描述。 外模式/模式映象:用于定义外模式和概念模式之间数据结构的对应性。 模式/内模式映象:用于定义概念模式和内模式之间数据结构的对应性。 数据独立性:应用程序和 DB 的数据结构之间相互独立,不受影响。 物理数据独立性:在 DB 的物理结构改变时,尽量不影响应用程序。 逻辑数据独立性:在 DB 的逻辑结构改变时,尽量不影响应用程序。 主语言:编写应用程序的语言(如 C 一类高级程序设计语言) ,称为主语言。 DDL:定义 DB 三级结构的语言,称为 DDL。 DML:对 DB 进行查询和更新操作的语言,称为 D
6、ML。 过程性语言:用户编程时,不仅需要指出“做什么” ,还需要指出“怎么做”的语言。 非过程性语言:用户编程时,只需指出“做什么” ,不需要指出“怎么做”的语言。 DD(数据字典):存放三级结构定义的 DB,称为 DD。 DD 系统:管理 DD 的软件系统,称为 DD 系统。 1.2 试解释 DB、DBMS 和 DBS 三个概念。 答:DB 是长期存储在计算机内、有组织的、统一管理的相关数据的集合。 DBMS 是位于用户与 OS 之间的一层数据管理软件,它为用户或应用程序提供访问 DB 的方法。 DBS 是实现有组织地、动态地存储大量关联数据、方便多用户访问的计算机硬件、软件 和数据资源组成
7、的系统,即采用数据库技术的计算机系统。 1.3 人工管理阶段和文件系统阶段的数据管理各有哪些特点? 答:人工管理阶段主要有四个特点: 数据不保存在计算机内;没有专用的软件对数据进 行管理;只有程序的概念,没有文件的概念;数据面向程序。 文件系统阶段主要有五个特点: 数据以“文件”形式长期保存;数据的逻辑结构与物理 结构有了区别;文件组织已多样化;数据面向应用;对数据的操作以记录为单位。 1.4 文件系统阶段的数据管理有些什么缺陷?试举例说明。 答:主要有三个缺陷:数据冗余;数据不一致性;数据联系弱。 例如学校里教务处、财务处、保健处建立的文件中都有学生详细资料,譬如联系电话, 家庭住址等。这就
8、是“数据”冗余;如果某个学生搬家,就要修改三个部门文件中的数据, 否则会引起同一数据在三个部门中不一致;产生上述问题的原因是这三个部门的文件中数据 没有联系。 1.5 数据管理的数据库阶段产生的标志是哪三件事情? 答:进入数据库阶段的标志是 20 世纪 60 年代末发生的三件事件: 1968 年 IBM 公司研制的 IMS 系统是一个典型的层次 DBS; 1969 年美国 CODASYL 组织 DBTG 报告,提出网状 DBS 的概念; 1970 年美国 IBM 公司的 E.F.Codd 发表论文,提出关系模型的思想。 (2003/9/21 ) (GJ-DA ) (共 2 页) 目录-3 1.
9、6 数据库阶段的数据管理有哪些特点? 答:主要有五个特点: 采用数据模型表示复杂的数据结构;有较高的数据独立性;为用户提供了方便的用户接 口;提供了四个方面的数据控制功能;对数据的操作以数据项为单位,增加了系统的灵活性。 1.7 与“文件”结构相比, “数据库”结构有些什么不同? 答:与文件结构相比,数据库结构主要有下面三点不同: 数据的结构化。文件由记录组成,但各文件之间缺乏联系。数据库中数据在磁盘中仍 以文件形式组织,但这些文件之间有着广泛的联系。数据库的逻辑结构用数据模型来描述, 整体结构化。数据模型不仅描述数据本身的特点,还要描述数据之间的联系。 数据独立性。文件只有设备独立性,而数据
10、库还具有逻辑独立性和物理独立性。 访问数据的单位。访问文件中的数据,以记录为单位。访问数据库中的数据,以数据 项(字段)为单位,增加了系统的灵活性。 1.8 什么是数据独立性?在数据库中有哪两级独立性? 答:数据独立性是指应用程序与 DB 的数据结构之间相互独立。在物理结构改变时,尽 量不影响应用程序,称为物理数据独立性;在逻辑结构改变时,尽量不影响应用程序,称为 逻辑数据独立性。 1.9 分布式数据库系统和面向对象数据库系统各有哪些特点? 答:DDBS 主要有三个特点: 数据物理上分布在各地,但逻辑上是一个整体; 每个场地既可以执行局部应用,也可以执行全局应用; 各地的计算机由数据通信网络相
11、连接。 面向对象数据系统主要有两个特点: 面向对象数据模型能完整地描述现实世界的数据结构,能表达数据间嵌套、递归的联 系。 具有面向对象技术的封装性和继承性的特点,提高了软件的可重用性。 1.10 逻辑记录与物理记录,逻辑文件与物理文件有些什么联系和区别? 答:逻辑数据是用户用以操作的数据形式,是抽象的概念化数据。物理数据是实际存放 在存储设备上的数据。 逻辑数据与物理数据在结构上可以差别很大,需通过两级映象来进行数据传输和格式转 换。 从以上的解释可以看出,逻辑记录和逻辑文件是用户在程序中使用的记录和文件,而物 理记录和物理文件是指磁盘上的记录和文件。逻辑记录、文件与物理记录、文件在结构、组
12、 成上有很大的差异,而数据管理软件就是通过三级结构两级映象来实现逻辑数据与物理数据 之间的转换。 1.11 试述 ER 模型、层次模型、网状模型、关系模型和面向对象模型的主要特点。 答:ER 模型直接表示实体类型及实体间联系,与计算机系统无关,充分反映用户的需 求,用户容易理解。 层次模型的数据结构为树结构,记录之间联系通过指针实现,查询较快,但 DML 属于 过程化的,操作复杂。 网状模型的数据结构为有向图,记录之间联系通过指针实现,查询较快,并且容易实现 M:N 联系,但 DML 属于过程化的语言,编程较复杂。 关系模型的数据结构为二维表格,容易为初学者理解。记录之间联系通过关键码实现。
13、DML 属于非过程化语言,编程较简单。 面向对象模型能完整描述现实世界的数据结构,具有丰富的表达能力,能表达嵌套、递 归的数据结构。但涉及的知识面较广,用户较难理解,这种模型尚未普及。 (2003/9/21 ) (GJ-DA ) (共 2 页) 目录-4 1.12 数据之间联系在各种结构数据模型中是怎么实现的? 答:在层次、网状模型中,数据之间的联系通过指针实现的; 在关系模型中,数据之间联系通过外键和主键间联系实现的; 在面向对象模型中,数据之间嵌套、递归联系通过对象标识符(OID)实现的(见第 8 章) 。 1.13 DB 的三级模式结构描述了什么问题?试详细解释。 答:DB 的三级模式结
14、构是对数据的三个抽象级别,分别从外部(用户)级、概念级和 内部级去观察数据库。 外部级是用户使用的局部数据库的逻辑结构,其描述称为外模式。 概念级是 DB 的整体逻辑结构,其描述称为概念模式。 内部级是 DB 的物理结构,其描述称为内模式。 1.14 试述概念模式在数据库结构中的重要地位。 答:数据按外模式的描述提供给用户,按内模式的描述存储在磁盘中,而概念模式提供 了连接这两级的相对稳定的中间观点,并使得两级的任何一级的改变都不受另一级的牵制。 1.15 试叙述用户、DB 的三级模式结构、磁盘上的物理文件之间有些什么联系和不同? 答:用户、外模式、概念模式、内模式和物理文件中的记录分别称为用
15、户记录、外部记 录、概念记录、内部记录和物理记录。 用户记录与外部记录的结构是一致的,它们之间只是数据传输问题。 而外部记录、概念记录和内部记录之间的结构可能是不一致的,除了数据传输问题,还 有格式转换问题。 内部记录与物理记录的结构是一致的,它们之间只是数据传输问题。 1.16 数据独立性与数据联系这两个概念有什么区别? 答:数据独立性是指应用程序和 DB 的数据之间相互独立,不受影响,对系统的要求是 “数据独立性要高” ,而数据联系是指记录之间的联系,对系统的要求是“数据联系密切” 。 1.17 试述 DBMS 的工作模式和主要功能。 答:DBMS 的工作模式有六点: 接受应用程序的数据请
16、求和处理请求; 将用户的数据请求转换成低层指令; 实现对 DB 的操作; 从对 DB 的操作中接受查询结果; 对查询结构进行处理; 将处理结果返回给用户。 DBMS 的主要功能有 DB 的定义、操纵、保护、维护和数据字典等五个功能。 1.18 试叙述 DBMS 对数据库的维护功能。 答:包括 DB 的数据载入、转换、转储、DB 的改组以及性能监控等功能。这些功能分 别由各个实用程序完成。 1.19 从模块结构观察,DBMS 由哪些部分组成? 答:DBMS 由两大部分组成:查询处理器和存储管理器。 (解释略) 1.20 DBS 有哪几部分组成?其中 DD 有什么作用? 答:DBS 由 DB、硬件
17、、软件和 DBA 等四个部分组成。 (解释略) 在 DBS 中,DD 是存储三级结构描述(即元数据)的 DB。DBMS 的所有工作都要以 DD 中的元数据为依据,也就是所有工作都要通过 DD 访问 DB。 1.21“元数据”与“数据”之间有些什么联系与区别? 答:元数据(metadata)是指“数据的数据” ,即数据的描述。DB 中的元数据是指三级 模式结构的详细描述。 数据(data) ,一般是指用户使用的具体值。 (2003/9/21 ) (GJ-DA ) (共 2 页) 目录-5 1.22 什么是 DBA?DBA 应具有什么素质?DBA 的职责是什么? 答:DBA 是控制数据整体结构的一
18、组人员,负责 DBS 的正常运行,承担创建、监控和 维护 DB 结构的责任。 DBA 必须具备下列 4 条素质:熟悉企业全部数据的性质和用途;对所有用户的需求有充 分的了解;对系统的性能非常熟悉;兼有系统分析员和运筹学专家的品质和知识。 DBA 的主要职责有 6 点:定义模式;定义内模式;与用户的联络;定义安全性规则;定 义完整性规则;DB 的转储与恢复。 1.23 试对 DBS 的全局结构作详细解释。 答:从四个方面解释: 数据库用户有四类:DBA,专业用户,应用程序员,终端用户。 DBMS 的查询处理器有四个模块:DML 编译器,嵌入型 DML 预编译器,DDL 编译 器,查询运行核心程序
19、。 DBMS 的存储管理器有四个模块:授权和完整性管理器,事务管理器,文件管理器, 缓冲区管理器。 磁盘存储器中有五种数据结构:数据文件,数据字典,索引文件,统计数据组织和日 志。 1.24 使用 DBS 的用户有哪几类? 答:(略,见习题 1.23) 1.25 DBMS 的查询处理器和存储管理器各有哪些功能? 答:(略,见习题 1.23) 1.26 磁盘存储器中有哪五类主要的数据结构? 答:(略,见习题 1.23) 1.27 根据计算机的系统结构,DBS 可分成哪四种?各有什么特点? 答:根据计算机的系统结构,DBS 可分成集中式、C/S 式、并行式和分布式等四种 集中式 DBS 的特点是单
20、点数据(DB 集中在一个场地)单地处理(单个 CPU) 。 C/S 式 DBS 的特点是计算机的功能分放在客户机和服务器上(即功能的分布) 。客户机上 专门实现前端处理和用户界面。服务器上完成事务处理和数据访问控制。 并行式 DBS 的特点是使用多个 CPU 和多个磁盘进行并行操作。 分布式 DBS 的特点是多点数据(DB 分布在多个场地)多点处理(多个 CPU) 。数据具有 物理分布性和逻辑整体性特点。系统中事务有本地事务(访问本地 DB)和全局事务(访问 至少两个场地的 DB)之分。 1.28 DBS 能产生哪些效益? 答:DBS 的应用,使计算机应用深入到社会的每个角落。其效益有以下 7
21、 个方面:灵活 性,简易性,面向用户,有效的数据控制,加快应用开发速度,维护方便,标准化。 1.3 自测题 1.3.1 填空题 1数据管理技术的发展,与_、_和_有密切的联系。 2文件系统中的数据独立性是指_独立性。 3文件系统的缺陷是:_、_和_。 4就信息处理的方式而言,在文件系统阶段,_处于主导地位,_只起着 服从程序设计需要的作用;而在数据库方式下,_占据了中心位置。 5对现实世界进行第一层抽象的模型,称为_模型;对现实世界进行第二层抽象 的模型,称为_模型。 6层次模型的数据结构是_结构;网状模型的数据结构是_结构;关系 (2003/9/21 ) (GJ-DA ) (共 2 页) 目
22、录-6 模型的数据结构是_结构;面向对象模型的数据结构之间可以_。 7在层次、网状模型中,用_导航数据;而在关系模型中,用_导航数 据。 8数据库的三级模式结构是对_的三个抽象级别。 9DBMS 为应用程序运行时开辟的 DB 系统缓冲区,主要用于 _和_。 10在数据库技术中,编写应用程序的语言仍然是 C 一类高级语言,这些语言被称为 _语言。 11在 DB 的三级模式结构中,数据按_ 的描述提供给用户,按_的描述 存储在磁盘中,而_提供了连接这两级的相对稳定的中间观点,并使得两级中 的任何一级的改变都不受另一级的牵制。 12层次、网状的 DML 属于_语言,而关系型 DML 属于_语言。 1
23、3DBS 中存放三级结构定义的 DB 称为_。 14从模块结构考察,DBMS 由两大部分组成:_和_。 15DBA 有两个很重要的工具:_和_。 16DBS 是_、_、_和_的集合体。 17DBS 的全局结构体现了其_结构。 18在 DBS 中,DB 在磁盘上的基本组织形式是_,这样可以充分利用 OS _的功能。 19根据计算机的系统结构,DBS 可分成四种类型:_、_、_和 _。 20数据独立性使得修改 DB 结构时尽量不影响已有的 _。 1.3.2 单项选择题(在备选答案中选出一个正确答案) 1在 DBS 中,DBMS 和 OS 之间关系是 A并发运行 B相互调用 COS 调用 DBMS
24、DDBMS 调用 OS 2在数据库方式下,信息处理中占据中心位置的是 A磁盘 B.程序 C.数据 D.内存 3DB 的三级体系结构是对_抽象的三个级别。 A.存储器 B.数据 C.程序 D. 外存 4DB 的三级模式结构中最接近外部存储器的是 A.子模式 B.外模式 C.概念模式 D.内模式 5DBS 具有“数据独立性”特点的原因是因为在 DBS 中 A.采用磁盘作为外存 B.采用三级模式结构 C.使用 OS 来访问数据 D.用宿主语言编写应用程序 6在 DBS 中, “数据独立性”和“数据联系”这两个概念之间联系是 A没有必然的联系 B同时成立或不成立 C前者蕴涵后者 D后者蕴涵前者 7数据
25、独立性是指 A数据之间相互独立 B应用程序与 DB 的结构之间相互独立 C数据的逻辑结构与物理结构相互独立 D数据与磁盘之间相互独立 8DB 中数据导航是指 A数据之间联系 B数据之间指针联系 C从已知数据找未知数据的过程 D数据的组合方式 9用户使用 DML 语句对数据进行操作,实际上操作的是 A数据库的记录 B内模式的内部记录 C外模式的外部记录 D数据库的内部记录值 (2003/9/21 ) (GJ-DA ) (共 2 页) 目录-7 10对 DB 中数据的操作分成两大类: A查询和更新 B检索和修改 C查询和修改 D插入和修改 1.3.3 问答题 1试对数据管理技术三个发展阶段作一详细
26、的比较。 2在用户访问数据库中数据的过程中,DBMS 起着什么作用? 3什么是“DB 的系统缓冲区”? 4DBS 中有哪些系统软件? 1.4 自测题答案 1.4.1 填空题答案 1硬件 软件 计算机应用 2设备 3数据冗余 数据不一致 数据联系弱 4程序设计 数据 数据 5概念 结构(或逻辑) 6树 有向图 二维表 嵌套和递归 7指针 关键码(或外键与主键) 8数据 9数据的传输 格式的转换 10宿主语言(或主语言,host language) 11外模式 内模式 概念模式 12过程性 非过程性 13数据字典(DD) 14查询处理器 存储管理器 15一系列实用程序 DD 系统 16数据库 硬件
27、 软件 DBA 17模块功能 18. 文件 管理外存(或文件系统) 19集中式 C/S 式 并行式 分布式 20应用程序 1.4.2 单项选择题答案 1D 2C 3B 4D 5B 6A 7B 8C 9C 10. A 1.4.3 问答题答案 1.答:数据管理技术三个发展阶段的详细比较见图 1.1。 人工管理阶段 文件系统阶段 数据库阶段 时 间 20 世纪 50 年代 60 年代 70 年代 环 外存 纸带、卡片、磁带 磁盘 大容量磁盘 境 软件 汇编语言 3GL、OS DBMS 计算机应用 科学计算 进入企业管理 企业管理 数据的管理者 用户(程序员) 文件系统 DBS 数据的针对者 面向某一
28、应用程序 面向某一应用 面向现实世界 数据的共享程度 无共享 共享性差、冗余度大 共享性高、冗余度 小 数据独立性 无独立性, 独立性差, 有高度的物理独立性, (2003/9/21 ) (GJ-DA ) (共 2 页) 目录-8 数据完全依赖于程序 有设备独立性 一定的逻辑独立性 数据的结构化 无结构 记录内有结构, 整体结构化, 整体结构性差 用数据模型描述 图 1.1 2答:在用户访问数据的过程中,DBMS 起着核心的作用,实现“数据三级结构转换” 的工作。 3答:在应用程序运行时,DBMS 在内存为其开辟一个程序工作区,称为“DB 的系统 缓冲区” 。这个工作区主要用于“数据的传输和格
29、式的转换” 。 4答:DBS 应包括 DBMS、OS、宿主语言和应用开发支撑软件等四部分系统软件。 DBMS 是管理 DB 的软件系统,但对硬盘的管理是由 OS 实现的,因此 DBS 中应包括 DBMS 和 OS 这两个主要的系统软件。 编写应用程序仍然是用 C 一类高级程序设计语言,这些语言在 DBS 中称为宿主语言。 为提高应用程序开发效率,需要像 Dephi、PowerBuilder 一类软件开发工具(即应用开 发支撑软件)开发应用程序。这些软件属于 4GL 范畴,可使应用系统开发生产率提高 20100 倍。 (2003/9/21 ) (GJ-DA ) (共 2 页) 目录-9 第 2
30、章 关系模型和关系运算理论 2.1 基本内容分析 2.1.1 本章重要概念 (1)基本概念 关系模型,关键码(主键和外键) ,关系的定义和性质,三类完整性规则,ER 模型到关 系模型的转换规则,过程性语言与非过程性语言。 (2)关系代数 五个基本操作,四个组合操作,七个扩充操作。 (3)关系演算 元组关系演算和域关系演算的原子公式、公式的定义。关系演算的安全性和等价性。 (4)关系代数表达式的优化 关系代数表达式的等价及等价转换规则,启化式优化算法。 (5)关系逻辑 谓词、原子、规则和查询,规则的安全性,用规则模拟关系代数表达式。 2.1.2 本章的重点篇幅 (1)教材中 P56 的例 2.7
31、(关系代数表达式的应用实例) 。 (2)教材中 P63 的例 2.19(元组表达式的应用实例) 。 (3)教材中 P81 的例 2.36(关系逻辑的规则表示) 。 2.1.3 重要内容分析 1关系代数表达式的运用技巧 (1)一般规则 对于只涉及到选择、投影、联接的查询可用下列表达式表示: ( (RS) 或者 ( (R S) 对于否定的操作,一般要用差操作表示,例如“检索不学 C2 课的学生姓名”。 对于检索具有“全部”特征的操作,一般要用除法操作表示,例如“检索学习全部课 程的学生姓名”。 (2) “检索不学 C2 课的学生姓名”,决不能用下式表示: SNAME,AGE ( C#C2 (S S
32、C) 一定要用“差”的形式: SNAME,AGE (S) SNAME,AGE ( C#=C2(S SC) (3)“检索学习全部课程的学生学号”,要用 S#,C# (SC) C#(C)表示, 而不能写成 S# (SC C#(C)形式。这是因为一个学生学的课程的成绩可能是不 一样的。 (4)对于教材 P56 的例 2.7 的 8 个查询语句的关系代数表达式,考生一定要掌握,这 是基础。 2非过程性语言与过程性语言的区别 编程时必须指出“干什么”及“怎么干”的语言,称为过程性语言;编程时只须指出 “干什么” ,不必指出“怎么干”的语言,称为非过程性语言。 两种语言的主要区别见图 2.1。 (2003
33、/9/21 ) (GJ-DA ) (共 2 页) 目录-10 过程性语言 非过程性语言 编程时,必须指出“怎么干” 编程时,不必指出“怎么干” 由用户进行数据导航 由系统进行数据导航 单记录处理方式 集合处理方式 属于 3GL 范畴 属于 4GL 范畴 C 语言,层次、网状 DML 等 关系 DML,软件开发工具等 图 2.1 2.2 教材中习题 2 的解答 2.1 名词解释 关系模型:用二维表格表示实体集,外键和主键表示实体间联系的数据模型,称为关 系模型。 关系模式:是对关系的描述,包括模式名、诸属性名、值域名和模式的主键。 关系实例:关系模式具体的值,称为关系实例。 属性:即字段或数据项
34、,与二维表中的列对应。属性个数,称为元数(arity) 。 域:属性的取值范围,称为域。 元组:即记录,与二维表中的行对应。元组个数,称为基数(cardinality) 。 超键:能惟一标识元组的属性或属性集,称为关系的超键。 候选键:不含有多余属性的超键,称为候选键。 主键:正在使用的、用于标识元组的候选键,称为主键。 外键:属性集 F 是模式 S 的主键,在模式 R 中也出现,那么称 F 是模式 R 的外键。 实体完整性规则:实体的主键值不允许是空值。 参照完整性规则:依赖关系中的外键值或者为空值,或者是相应参照关系中某个主键 码。 过程性语言:编程时必须给出获得结果的操作步骤,即指出“干
35、什么”及“怎么干” 的语言。 非过程性语言:编程时,只需指出需要什么信息,不必给出具体的操作步骤,即只要 指出“干什么” ,不必指出“怎么干”的语言。 无限关系:指元组个数为无穷多个的关系。 无穷验证:验证公式真假时需要进行无限次验证。 2.2 在关系模型中,对关系作了哪些规范性限制? 答:对关系作了一下四个限制: 属性值不可分解;没有重复元组;没有行序;使用时有列序。 2.3 为什么关系中的元组没有先后顺序,且不允许有重复元组? 答:由于关系定义为元组的集合,而集合中的元素是没有顺序的,因此关系中的元组也 就没有先后的顺序(对用户而言) 。这样既能减少逻辑排序,又便于在关系数据库中引进集 合
36、论的理论。 每个关系模式都有一个主键,在关系中主键值是不允许重复的。如果关系中有重复元组, 那么其主键值肯定相等,起不了惟一标识作用,因此关系中不允许有重复元组。 2.4 外键值何时允许空?何时不允许空? 答:在依赖表中,当外键是主键的组成部分时,外键值不允许空;否则外键值允许空。 2.5 笛卡儿积、等值联接、自然联接三者之间有什么区别? 答:笛卡尔积是一个基本操作,而等值联接和自然联接是组合操作。 设关系 R 的元数为 r,元组个数为 m;关系 S 的元数为 s,元组个数为 n。 那么,R S 的元数为 r+s,元组个数为 mn; RS 的元数也是 r+s,但元组个数小于等于 mn; ij
37、(2003/9/21 ) (GJ-DA ) (共 2 页) 目录-11 RS 的元数小于等于 r+s,元组个数也小于等于 mn; 2.6 设有关系 R 和 S: R A B C S A B C 3 6 7 3 4 5 2 5 7 7 2 3 7 2 3 4 4 3 计算 RS,R-S,RS,RS, 3,2(S), B6 (S RR) 2.16 设两个关系 R (A, B )和 S (A,C )。用 null 表示空值,分别写出等价于下列表 达式的元组关系演算表达式: R S; R S; R S 。 解: R S: t | (u) (v) (R(u) S(v) u1=v1 t1=u1 t2=u2
38、 t3=v2) (v) (u) (S(v) R(u) v1 u1 t1=null t2=v1 t3=v2) R S: t | (u) (v) (R(u) S(v) u1=v1 t1=u1 t2=u2 t3=v2) (u) (v) (R(u) S(v) u1 v1 t1=u1 t2=u2 t3=null) (v) (u) (S(v) R(u) v1 u1 t1=null t2=v1 t3=v2) R S: t | (u) (v) (R(u) S(v) u1=v1 t1=u1 t2=u2 t3=v2) (u) (v) (R(u) S(v) u1 v1 t1=u1 t2=u2 t3=null) (2
39、003/9/21 ) (GJ-DA ) (共 2 页) 目录-15 2.17 设有三个关系: S(S#,SNAME,AGE,SEX) SC(S#,C#,CNAME) C(C#,CNAME,TEACHER) 试用关系代数表达式表示下列查询语句: 检索 LIU 老师所授课程的课程号和课程名。 检索年龄大于 23 岁的男学生的学号和姓名。 检索学号为 S3 学生所学课程的课程名与任课教师名。 检索至少选修 LIU 老师所授课程中一门课的女学生姓名。 检索 WANG 同学不学的课程的课程号。 检索至少选修两门课的学生学号。 检索全部学生都选修的课程的课程号与课程名。 检索选修课程包含 LIU 老师所授
40、全部课程的学生学号。 解: C#,CNAME ( TNAME=LIU(C) S#,SNAME ( AGE23 SEX=M (SC ) CNAME,TNAME ( S#=S3(SC C) SNAME( SEX=F TNAME=LIU (S SCC) C#(C ) C#( SNAME=WANG(S SC) 1( 1=4 25 (SCSC) C#,CNAME (C ( S#,C# (SC) S#(S) S#,C# (SC ) C#( TNAME=LIU(C) 2.18 试用元组表达式表示第 2.17 题中各个查询语句。 解: t | (u) (C(u) u3=LIU t1=u1 t2=u2) t |
41、 (u) (S(u) u323 u4=M t1=u1 t2=u2) t | (u) (v) (SC(u) C(v) u1=S3 u2=v1 t1=v2 t2=v3) (此处自然联接条件 u2=v1不要遗漏) t | (u) (v) (w) (S(u) SC(v) C(w) w3=LIU u4=F u1=v1 v2=w1 t1=u2) (此处自然联接条件 u1=v1和 v2=w1不要遗漏) t | (u) (v) (w) (C(u) S(v) SC(w) v2=WANG (w1=v1 = w2u1) t1=u1) 其意思是:在关系 C 中存在一门课程,在关系 S 中存在一个 WANG 同学,在关
42、系 SC 中要求不存在 WANG 同学学这门课程的元组。也就是要求在关系 SC 中,WANG 同学学的 (2003/9/21 ) (GJ-DA ) (共 2 页) 目录-16 课程都不是这门课程(因此在元组表达式中要求全称量词)。 t | (u) (v) (SC(u) SC(v) u1=v1 u2v2 t1=u1) t | (u) (v) (w) (C(u) S(v) SC(w) w2=u1 w1=v1 t1=u1 t2=u2) 其意思是:在关系 C 中找一课程号,对于关系 S 中每一个学生,都应该学这门课(即在 关系 SC 中存在这个学生选修这门课的元组)。 t | (u) (SC(u) (
43、v) (C(v) (v3=LIU = (w) (SC(w) w1=u1 w2=v1) t1=u1) 其意思是:在关系 SC 中找一个学号,对于关系 C 中 LIU 老师的每一门课,这个学生都 学了(即在关系 SC 中存在这个学生选修这门课的元组)。 由于在括号中出现“=”符号(包含有“”的语义),因此括号中的量词(w)就 不能随意往左边提了。 2.19 试用域表达式表示第 2.17 题的各个查询语句。 解: t1 t2 | (u1 u2 u3) (C(u1 u2 u3) u 3=LIU t 1=u1 t 2=u2) 再简化成: t 1 t2 | C(t1 t2 LIU) 此处( u1 u2 u
44、3)是( u1) (u2) (u3) 的简写,下同。 t 1 t2 | (u1 u2 u3 u4) (S(u1 u2 u3 u4) u 323 u 4=M t 1=u1 t 2=u2) 再简化成: t 1 t2 | (u3) (S(t1 t2 u3 M) u 323)(以下各题的化简略) t 1 t2 | (u1 u2 u3) (v1 v2 v3) (SC(u1 u2 u3) C(v 1 v2 v3) u 1=s3 u 2= v1 t 1=v2 t 2=v3) t 1 | (u1 u2 u3 u4) (v1 v2 v3) (w1 w2 w3) (S(u1 u2 u3 u4) SC(v 1 v2
45、 v3) C(w 1 w2 w3) w 3=LIU u 4=F u 1=v1 v 2=w1 t 2=u2) (题的域表达式,读者可以很容易写出,此处略) 2.20 设关系 R 和 S 的属性集相同,W 是 R 的属性集的子集,试说明下列等式是否成立, 并指出它们的正确表示: W(RS) = W(R) W(S) W(RS) = W(R) W(S) W(RS) = W(R) W(S) 答: W(RS) = W(R) W(S)是一个错误的式子。 譬如 R 只有一个元组(1,2,3) ,S 只有一个元组(1,2,4) ,W 为 R、S 中前两个属性。 显然 R 和 S 不满足上式。正确的式子应该是 W(RS) = W(R)S。 W(RS) = W(R) W(S)是一个错误的式子。 譬如 R 只有一个元组(1,2,3) ,S 只有一个元组(1,2,4) ,W 为 R、S 中前两个属性。