1、第 1、2 章1.1 名词解释: DB:数据库(Database),DB 是统一管理的相关数据的集合。DB 能为各种用户共享,具有最小冗余度,数据间联系密切,而又有较高的数据独立性。 DBMS:数据库管理系统(Database Management System),DBMS 是位于用户与操作系统之间的一层数据管理软件,为用户或应用程序提供访问 DB 的方法,包括 DB 的建立、查询、更新及各种数据控制。DBMS 总是基于某种数据模型,可以分为层次型、网状型、关系型、面向对象型 DBMS。 DBS:数据库系统(Database System),DBS 是实现有组织地、动态地存储大量关联数据,方便
2、多用户访问的计算机软件、硬件和数据资源组成的系统,即采用了数据库技术的计算机系统。 1:1 联系:如果实体集 E1 中的每个实体最多只能和实体集 E2 中的一个实体有联系,反之亦然,好么实体集 E1 对 E2 的联系称为“一对一联系”,记为“1:1”。 1:N 联系:如果实体集 E1 中每个实体与实体集 E2 中任意个(零个或多个)实体有联系,而 E2 中每个实体至多和 E1 中的一个实体有联系,那么 E1对 E2 的联系是“一对多联系”,记为“1:N”。 M:N 联系:如果实体集 E1 中每个实体与实体集 E2 中任意个(零个或多个)实体有联系,反之亦然,那么 E1 对 E2 的联系是“多对
3、多联系”,记为“M:N”。 数据模型:表示实体类型及实体类型间联系的模型称为“数据模型”。它可分为两种类型:概念数据模型和结构数据模型。 概念数据模型:它是独门于计算机系统的模型,完全不涉及信息在系统中的表示,只是用来描述某个特定组织所关心的信息结构。 结构数据模型:它是直接面向数据库的逻辑结构,是现实世界的第二层抽象。这类模型涉及到计算机系统和数据库管理系统,所以称为“结构数据模型”。结构数据模型应包含:数据结构、数据操作、数据完整性约束三部分。它主要有:层次、网状、关系三种模型。 层次模型:用树型结构表示实体间联系的数据模型 网状模型:用有向图结构表示实体类型及实体间联系的数据模型。 关系
4、模型:是由若干个关系模式组成的集合,其主要特征是用二维表格结构表达实体集,用外鍵表示实体间联系。 概念模式:是数据库中全部数据的整体逻辑结构的描述。它由若干个概念记录类型组成。概念模式不仅要描述概念记录类型,还要描述记录间的联系、操作、数据的完整性、安全性等要求。 外模式:是用户与数据库系统的接口,是用户用到的那部分数据的描述。 内模式:是数据库在物理存储方面的描述,定义所有的内部记录类型、索引和文件的组成方式,以及数据控制方面的细节。 模式/内模式映象:这个映象存在于概念级和内部级之间,用于定义概念模式和内模式间的对应性,即概念记录和内部记录间的对应性。此映象一般在内模式中描述。 外模式/模
5、式映象:这人映象存在于外部级和概念级之间,用于定义外模式和概念模式间的对应性,即外部记录和内部记录间的对应性。此映象都是在外模式中描述。 数据独立性:在数据库技术中,数据独立性是指应用程序和数据之间相互独立,不受影响。数据独立性分成物理数据独立性和逻辑数据独立性两级。 物理数据独立性:如果数据库的内模式要进行修改,即数据库的存储设备和存储方法有所变化,那么模式/内模式映象也要进行相应的修改,使概念模式尽可能保持不变。也就是对模式的修改尽量不影响概念模式。 逻辑数据独立性:如果数据库的概念模式要进行修改(如增加记录类型或增加数据项),那么外模式/模式映象也要进行相应的修改,使外模式尽可能保持不变
6、。也就是对概念模式的修改尽量不影响外模式和应用程序。 宿主语言:编写应用程序的语言(即高级程序设计语言)在数据库技术中称为宿主语言(host language),简称主语言。 DDL:数据定义语言(Data Definition Language),用于定义数据库的三级结构,包括外模式、概念模式、内模式及其相互之间的映象,定义数据的完整性、安全控制等约束。 DML:数据操纵语言(Data Manipulation Language),用于让用户或程序员使用,实现对数据库中数据的操作。基本的数据操作分成两类四种:检索(查询)和更新(插入、删除、修改)。DML 分成交互型 DML 和嵌入型 DML
7、 两类。依据语言的级别,DML 又可分成过程性 DML 和非过程性 DML 两种。 交互型 DML:这类 DML 自成系统,可在终端上直接对数据库进行操作。 嵌入型 DML:这类 DML 是嵌入在主语言中使用。此时主语言是经过扩充能处理 DML 语句的语言。 过程性 DML:用户编程时,不仅需要指出“做什么”(需要什么样的数据),还需要指出“怎么做”(怎么获得数据)。层状、网状的 DML 属于过程性语言。 非过程性 DML:用户编程时,只需要指出“做什么”,不需要指出“怎么做”。关系型 DML 属于非过程性语言。 DD:数据字典(Data Dictionary),数据库系统中存放三级结构定义的
8、数据库称为数据字典。(通常 DD 还存放数据库运行时的统计信息) DD 系统:管理 DD 的实用程序称为“DD 系统”。1.2 文件系统阶段的数据管理有些什么缺陷?试举例说明。答 :文件系统有三个缺陷:(1)数据冗余性(redundancy)。由于文件之间缺乏联系,造成每个应用程序都有对应的文件,有可能同样的数据在多个文件中重复存储。(2)数据不一致性(inconsistency)。这往往是由数据冗余造成的,在进行更新操作时,稍不谨慎,就可能使同样的数据在不同的文件中不一样。(3)数据联系弱(poor data relationship)。这是由文件之间相互独立,缺乏联系造成的。1.3 数据库
9、阶段的数据管理有些什么特点?答 :有五方面的特征:(1)采用复杂的数据模型表示数据结构。(2)有较高的数据独立性。(3)数据库系统为用户提供方便的用户接口。(4)系统提供四个方面的数据控制功能:数据库的恢复、并发控制、数据完整性、数据安全性,以保证数据库中数据是安全的、正确的、可靠的。(5)对数据的操作不一定以记录为单位,也可以以数据项为单位,增加了系统的灵活性。1.4 你怎样理解实体、属性、记录、字段这些概念的类型和值的差别?试举例说明。答 :实体(entity):是指客观存在可以相互区别的事物。实体可以是具体的对象,如:一个男学生,一辆汽车等;也可以是抽象的事件,如:一次借书、一声场球赛等
10、。属性(attribute):实体有很多特性,每一个特性称为属性。每个属性有一个值域,其类型可以是整数型、实数型、字符串型。如:学生(实体)有学号、姓名、年龄、性别等属性,相应值域为字符、字符串、整数和字符串型。字段(field):标记实体属性的命名单位称为字段或数据项。它是可以命名的最小信息单位,所以又称为数据元素或初等项。字段的命名往往和属性相同,如:学生有学号、姓名、年龄、性别等字段。记录(record):字段的有序集合称为记录。一般用一个记录描述一个实体,所以记录又可以定义为能完整地描述一个实体的字段集。如:一个学生记录,由有序的字段集(学号、姓名、年龄、性别等)组成。2.2 逻辑记录
11、与物理记录,逻辑文件与物理文件有些什么联系和区别?答 :数据描述有两形式:物理描述和逻辑描述。物理数据描述是指数据在存储设备上的存储方式,物理数据是实际存放在存储设备上的数据。 物理记录、物理文件(还有物理联系、物理结构等术语),都是用来描述存储数据的细节。逻辑数据描述是指程序员或用户用以操作的数据形式,是抽象的概念化数据。 逻辑记录、逻辑文件(还有逻辑联系、逻辑结构等术语),都是用户观点的数据描述。2.3 为某百货公司设计一个 ER 模型。百货管辖若干个连锁商店,每家商店经营若干商品,每家商店有若干职工,但每个职工只能服务于一家商店。实体类型“商店”的属性有:商店编号,店号,店址,店经理。实
12、体类型“商品”的属性有:商品编号,商品名,单价,产地。实体类型“职工”的属性有:职工编号,职工名,性别,工资。在联系中应反映出职工参加某商店工作的开始时间,商店销售商品的有销售量。试画出反映商店、商品、职工实体类型及联系类型的 ER 图,并将其转换成关系模式集。答 :实体:商店(商店编号,店号,店址,店经理)商品(商品编号,商品名,单价,产地)职工(职工编号,职工名,性别,工资)联系:P1商店销售商品的有销售量间P2职工参加某商店工作的开始时ER 图:关系模式集:商店模式(商店编号,店号,店址,店经理)商品模式(商品编号,商品名,单价,产地)职工模式(职工编号,职工名,性别,工资)P1 模式(
13、商店编号,商品编号,月销售量)P2 模式(商店编号,职工编号,开始时间)2.4 试述 ER 模型、层次模型、网状模型、关系模型和面向对象模型的主要特点。答 :ER 模型的主要特点:(1)接近于人的思维,容易理解;(2)与计算机无关,用户容易接受。层次模型的特点:记录之间的联系通过指针实现,查询效率较高。网状模型的特点:记录之间联系通过指针实现,M:N 联系也容易实现(每个 M:N 联系可拆成两个 1:N 联系),查询效率较高。关系模型的特点:用关鍵码而不是用指针导航数据,表格简单,用户易懂,编程时并不涉及存储结构、访问技术等细节。2.7 试述概念模式在数据库结构中的重要地位。答 :概念模式(
14、定义 )是数据库中全部数据的整体逻辑结构的描述。它由若干个概念记录类型组成。概念模式不仅要描述概念记录类型,还要描述记录间的联系、操作、数据的完整性、安全性等要求。数据按外模式的描述提供给用户,按内模式的描述存储在磁盘中,而概念模式提供了连接这两级的相对稳定的中间观点,并使得两级的任何一级的改变都不受另一级的牵制。2.9 数据独立性与数据联系这两个概念有什么区别?答 :数据独立性是指应用程序与数据之间相互独立,不受影响。数据联系是指同一记录内部各字段间的联系,以及记录之间的联系。2.11 试述 DBMS 的主要功能。答 :DBMS 的主要功能有:(1)数据库的定义功能(2)数据库的操纵功能 (
15、3)数据库的保护功能(4)数据库的存储管理(5)数据库的维护功能 (6)数据字典2.12 试叙 DBMS 对数据库的保护功能。答 :DBMS 对数据库的保护主要通过四个方面实现:(1)数据库的恢复。 (2)数据库的并发控制。(3)数据库的完整性控制。(4)数据库的安全性控制。2.13 试叙 DBMS 对数据库的维护功能。答 :DBMS 中主要有四个实用程序提供给数据库管理员运行数据库系统时使用,起着数据库维护的功能:(1)数据装载程序(loading)(2)备份程序(backup)(3)文件重组织程序 (4)性能监控程序2.14 从模块结构看,DBMS 由哪些部分组成?答 :从模块结构看,DB
16、MS 由两大部分组成:查询处理器和存储管理器(1)查询处理器有四个主要成分:DDL 编译器,DML 编译器,嵌入型DML 的预编译器,查询运行核心程序(2)存储管理器有四个主要成分:授权和完整性管理器,事务管理器,文件管理器,缓冲区管理器2.15 DBS 由哪几个部分组成?答 :DBS 由四部分组成:数据库、硬件、软件、数据库管理员。2.17 什么样的人是 DBA?DBA 应具有什么素质?DBA 的职责是什么?答 :DBA 是控制数据整体结构的人,负责 DBS 的正常运行。DBA 可以是一个人,在大型系统中也可以是由几个人组成的小组。DBA 应具有下列素质:(1)熟悉企业全部数据的性质和用途;
17、(2)对用户的需求有充分的了解;(3)对系统的性能非常熟悉。DBA 的主要职责有五点:(1)概念模式定义(2)内模式定义(3)根据要求修改数据库的概念模式和内模式(4)对数据库访问的授权(5)完整性约束的说明2.19 使用 DBS 的用户有哪几类? 答 :使用 DBS 的用户有四类:1)DBA2)专业用户3)应用程序员4)最终用户3.1 名词解释: 关系模型:用二维表格结构表示实体集,外键表示实体间联系的数据模型称为关系模型。关系模型是由若干个关系模式组成的集合。 关系模式:关系模式实际上就是记录类型。它包括:模式名,属性名,值域名以及模式的主键。关系模式仅是对数据特性的描述。 关系实例:就是
18、一个关系,即一张二维表格。 属性:在关系模型中,字段称为属性。 域:在关系中,每一个属性都有一个取值范围,称为属性的值域。 元组:在关系中,记录称为元组。 超键:在一个关系中,能唯一标识元组的属性或属性集。 候选键:不含有多余属性的超键称为候选键。 主键:用户选作元组标识的一个候选键为主键。 外键:某个关系的主键相应的属性在另一关系中出现,此时该主键在就是另一关系的外键,如有两个关系 S 和 SC,其中 S#是关系 S 的主键,相应的属性 S#在关系 SC 中也出现,此时 S#就是关系 SC 的外键。 实体完整性规则:这条规则要求关系中元组在组成主键的属性上不能有空值。如果出现空值,那么主键值
19、就起不了唯一标识元组的作用。 参照完整性规则:这条规则要求“不引用不存在的实体”。其形式定义如下:如果属性集 K 是关系模式 R1 的主键,K 也是关系模式 R2 的外键,那么 R2 的关系中,K 的取值只允许有两种可能,或者为空值,或者等于R1 关系中某个主键值。 这条规则在使用时有三点应注意: 1)外键和相应的主键可以不同名,只要定义在相同值域上即可。 2)R1 和 R2 也可以是同一个关系模式,表示了属性之间的联系。 3)外键值是否允许空应视具体问题而定。 过程性语言:在编程时必须给出获得结果的操作步骤,即“干什么”和“怎么干”。如 Pascal 和 C 语言等。 非过程性语言:编程时只
20、须指出需要什么信息,不必组出具体的操作步骤的语言,各种关系查询语言均属于非过程性语言。 3.2 为什么关系中的元组没有先后顺序?答:因为关系是一个集合,因此不考虑元组间的顺序,即没有行序。3.3 为什么关系中不允许有重复元组?答:如果关系中有重复元组,那么就无法用键来标识唯一的元组。因此在关系模型中对关系作了限制。3.4 关系与普通的表格、文件有什么区别?答:总而言之,关系是一种规范化了的二维表格,在关系模型中,对关系作了下列规范性限制:1)关系中每一个属性值都是不可分解的。2)关系中不允许出现相同的元组(没有重复元组)。3)由于关系是一个集合,因此不考虑元组间的顺序,即没有行序。4)元组中,
21、属性在理论上也是无序的,但在使用时按习惯考虑列的顺序。3.5 笛卡尔积、等值联接、自然联接三者之间有什么区别?答:笛卡尔积对两个关系 R 和 S 进行操作,产生的关系中元组个数为两个关系中元组个数之积。等值联接则是在笛卡尔积的结果上再进行选择操作,挑选关系第 i 个分量与第(r+j)个分量值相等的元组;自然连接则是在等值联接(以公共属性值相等为条件)的基础上再行投影操作,去掉 S 中的公共属性列,当两个关系没有公共属性时,自然连接就转化笛卡尔积。3.8 假设 R 和 S 分别是三元和二元关系,试把表达式 1,5( 2=43=4 (RS)转换成等价的:(1)汉语查询句子;(2)元组表达式;(3)
22、域表达式。解:(1)汉语表达式:选择 RS 关系中元组第 2 分量或第 3 分量与第 4 分量值相等的元组并取第 1 列与第 5 列组成的新关系。(2)元组表达式:t|( u)( v)(R(u)S(v)(u2=v4u3=v4)t1=u1t2=v2)(3)域表达式:xv|( y)( z)( u)(R(xyz)S(uv)(y=uz=u)3.10 试把域表达式ab|R(ab)R(ba)转换成等价的:(1)汉语查询句子;(2)关系代数表达式;(3)元组表达式。解:(1)汉语查询句子:选择 R 中元组第 1 分量值与第 2 分量值互换后仍存在于 R 中的元组。(2)关系代数表达式: 1,2 ( 1=42
23、=3 (RR);(3)元组表达式:t|( u)(R(t)R(u)t1=u2t2=u1)3.11 设有两个关系 R(A,B,C)和 S(D,E,F),试把下列关系代数表达式转换成等价的元组表达式:(1) A(R);(2) B=17(R);(3)RS;(4) A,F( C=D(RS)解:(1)t|( u)(R(t)R(u)t1=u1)(2)t|R(t)t2=17)(3)t|( u)( v)(R(u)S(v)t1=u1t2=u2t3=u3t4=v1t5=v2t6=v3)(4)t|( u)( v)(R(u)S(v)u3=v4t1u1t2=v3)3.12 设有三个关系:S(S#,SNAME,AGE,SE
24、X)SC(S#,C#,GRADE)C(C#,CNAME,TEACHER) 试用关系代数表达式表示下列查询语句。3.13 试用元组表达式表示上题中各个查询语句。解:上两题一并作答:(前者为关系代数表达式,后者为元组表达式。) (1)检索 LIU 老师所授课程的课程号、课程名。 C#,CNAME( TEACHER=LIU(C) t|( u)(C(u)t3=LIUt1=u1t2=u3) (2)检索年龄大于 23 岁的男学生的学号与姓名。 S#,SNAME( AGE23SEX=男 (S) t|( u)(S(u)uAGE23uSEX=男t1=uS#t2=uSNAME) (这里分量用属性表示,当然也可用数
25、字) 检索学号为 S3 学生所学课程的课程名与任课教师名。 CNAME,TEACHER( S#=S3SC.C#=C.C# (SCC) (也可将两个关系自然连接后选择、投影) t|( u)( v)( w)(S(u)SC(v)C(w)u1=S3v1=u1v2=w1t1=w2t2=w3) 检索至少选修 LIU 老师所授课程中一门课程的女学生的姓名。 SNAME( SEX=女TEACHER=LIU (S|X|SC|X|C) t|( u)( v)( w)(S(u)SC(v)C(w)uSEX=女vS#=uS#vC#=wC#wTEACHER=LIUt1=uSNAME) 检索 WANG 同学不学的课程号。 C#(SC)- C#( SNAME=WANGS.S#=SC.S# (SSC) t|( u)( v)(S(u)SC(v)uSNAME=WANGuS#vS#t1=vC#)