1、5 第七章 数据库设计作业1. 试述数据库设计过程。需求分析;概念结构设计;逻辑结构设计;物理结构设计;数据库实施;数据库运行和维护。2. 什么叫数据抽象?见需求分析得到的用户需求抽象为信息结构(即概念模型)的过程就是概念结构设计。3. 为什么要视图集成?视图集成的方法是什么?在开发一个大型信息系统时,最经常采用的策略是自顶向下地进行需求分析,然后再自底向上地设计概念结构。即首先设计各子系统的分 E-R 图,然后将它们集成起来,得到全局 E-R 图。E-R 图的集成一般需要分两步走:(1)合并 E-R 图,生成初步 E-R 图;(2 )消除不必要的冗余,设计基本 E-R 图。4. 现有一个学校
2、信息系统。该学校有多个系,描述系的信息有:系编号、系名每个系有多名教师,描述教师的信息有:教师编号、教师名、研究领域。每个教师只能属于一个系,一个系可以有多个老师。每个系都有一个教师作为系主任,每个教师只能在一个系当系主任每个系有多个班级,描述班级的信息有:班级编号、班级名、专业,每个班级只属于一个系。每个班级有多个学生,每个学生只能属于一个班级。描述学生的信息有:学号、姓名、年龄、性别。每个班级都有一个学生担任班长,一个学生只能在一个班级担任班长。有的学生担任指导员,一个指导员可以管理多个学生,每个学生只能有一个指导员。一个系可以有多门课程,每门课可以在多个系开课。描述课程的信息有:课程编号
3、、课程名、学时、学分一个教师可以讲多门课,一门课可以被多个教师讲。一个学生可以选择多门课,一门课可以被多个学生学。但当一个学生选定一门课时,就有一个确定的老师。一个学生选定的每一门课程都有一个成绩。要求:(1 ) 画出 ER 图(2 ) 将其转换为关系模式,并规范化到 3NF。系(系编号,系名称)教师(教师编号,教师名,研究领域)外码:系编号课程(课程名,课程编号,学时,学分)外码:系编号班级(班级编号,班级名,专业)外码:系编号学生(学号,姓名,年龄,性别,班长)外码:班级编号选课(学生,课程,教师)外码:学号(3 )指出每个关系模式的主码和外码。第九章 查询优化1. 试述查询优化的一般准则
4、和主要步骤查询优化的总目标是选择有效的策略,求给定关系表达式的值,值得查询代价较小,因为查询优化的搜索空间有时非常大,实际系统选择的策略不一定是最优的,而是较优的。(1 )计算广义笛卡尔积(2)做选择操作(3)做投影操作2. 简述选择、连接等关系代数操作的实现算法。代数优化策略是通过对关系代数表达式的等价变换来提高查询效率。所谓关系代数表达上司的等价是指用相同的关系代替两个表达式中相应的关系得到的结果是相同的。第十章 数据库恢复1. 试述事务的概念及事务的四个特性。恢复技术可以保证事务的哪些特性?所谓事务是用户定义的一个数据库操作序列,这些操作要么全做,要么全不做,只一个不可分割的工作单位。事
5、务具有 4 个特性:原子性,一致性,隔离性和持续性,这 4 个特性简称 ACID 特性。恢复技术可以保证事务的原子性,一致性与持续性。2. 数据库运行中可能产生的故障有哪几类?事物内部故障;系统故障;介质故障;计算机病毒。4. 数据库恢复的基本技术有哪些?对每种技术做简要的描述恢复机制涉及的两个关键问题是:如何建立冗余数据,以及如何利用这些冗余数据实施数据库恢复。建立冗余数据最常用的技术是数据转储和登记日志文件。通常在一个数据库系统中,这两种方法是一起使用的。数据转储是数据库恢复中采用的基本技术。所谓转储即数据库管理员定期地将整个数据库复制到磁带、磁盘或其他存储介质上保存起来的过程。这些备用的
6、数据成为后备副本或后援副本。日志文件是用来记录事务对数据库的更新操作的文件。不同数据库系统采用的日志文件格式并不完全一样。概括起来日志文件主要有两种格式:以记录为单位的日志文件和以数据块为单位的日志文件。5. 给出不同故障的恢复策略和方法。事务故障是指事务在运行至正常重点前被终止,这时恢复子系统应利用日志文件撤销此事务已对数据库进行的修改。事务故障的恢复是由系统自动完成的,对用户是透明的。系统恢复的步骤是:(1)反向扫描日志文件,查找该事务的更新操作。 (2 )对该事务的更新操作执行逆操作,即将日志目录中“更新前的值”写入数据库。这样,如果记录中是插入操作,则相当于做删除操作(因此时“更新前的
7、值”为空) ;若记录中的是删除操作,则做插入操作;若是修改操作,则相当于修改前置代替修改后的值。(3 )继续反向扫描日志文件,查找该事务的其他更新操作,并做同样处理。 (4 )如此处理下去,直至读到此事务的开始标记,事务故障恢复就完成了。系统故障的恢复是由系统在重新启动时自动完成的,不需要用户干预。系统恢复的步骤是:(1)正相扫描日志文件(即从头扫描日志文件) ,找出在故障发生之前已经提交的事务。将其事务标识计入重做队列。同事找出故障发生时尚未完成的食物,将其事务标识记入撤销队列。 (2)对撤销队列中的各个事务进行撤销处理。进行撤销处理的方法是,反向扫描日志文件,对每个撤销事务的更新操作执行逆
8、操作,即将日志记录中“更新前值”写入数据库。 (3)对重做队列中的各个失误进行重做处理。对重做处理的方法是:正向扫描日志文件,最每个崇左市五重新执行日志文件登记的操作,即将日志文件中“更新后的值”写入数据库。发生介质故障后,磁盘上的物理数据和日志文件被破坏,这是最严重的一种故障,恢复方法是重装数据库,然后崇左已完成的事物。 (1)装入最新的数据库后备副本,是数据库恢复到最近一次转储时的一致性状态。对于动态转储的数据库副本,还需同时装入转储开始时刻的日志文件副本,利用恢复系统故障的方法,才能将数据库恢复到一致性状态。 (2)装入相应的日志文件副本,重做已完成的事务。即首先扫描日志文件,找出故障发
9、生时已提交的事务的标识,将其计入重做队列;然后正向扫描日志文件。对重做队列中的所有事物进行重做处理。即将日志记录中“更新后的值”写入数据库。5. 具有检查点的恢复技术有什么特点?这种技术在日志文件中增加一类新的记录检查点记录,增加一个重新开始文件,并让恢复子系统在登录日志文件期间动态的维护日志。使用检查点方法可以改善恢复效率。第十一章 并发控制1. 并发操作有什么优点?但可能会产生哪几种数据不一致?为了保证施工 I,数据库管理系统需要对兵法操作进行正确调度。并发操作带来的数据不一致性包括丢失修改、不可重复读和读“脏”数据。2. 什么是封锁及锁协议?封锁就是事务 T 在对某个数据对象例如表、记录
10、等操作之前,现象系统发出请求没对其加锁。加锁后事务 T 就对该数据对象有了一定的控制,在事务 T 释放它的锁之前,其他事务不能更新此数据对象。在运用 X 锁和 S 锁这两种基本封锁对数据对象甲所示,还需要约定一些规则。例如,何时申请 X 锁或 S 锁、持锁时间、和实施方等。这些规则成为封锁协议。3. 什么是死锁、活锁?相应的解决方法是什么?T2 有可能永远等待,这就是活锁。T1 在等待 T2,二 T2 又在等待 T1 的局面,T1 和 T2两个事务永远不能劫数,形成死锁。避免活锁的简单方法是采用先来先服务的策略。目前解决数据库中死锁问题主要有两类方法,一类方法是采取一定措施来预防死锁的发生。另
11、一类方法是允许发生死锁,采用一定手段定期诊断系统中有无死锁,若有则解除之。4. 什么样的并发调度是正确的?怎样得到正确的并发调度?串行调度是正确的。执行结果等价于串行调度的调度也是正确的。这样的调度叫做可串行化调度。可串行性是并发事务正确调度的准则。按这个准则规定,一个给定的并发调度,当且仅当它是可串行化的,才认为是正确调度。5. 简单介绍多粒度封锁和意向锁的概念。多粒度封锁协议允许多粒度树中的每个结点被独立的加锁。对一个结点加锁意味着这个节点的所有后裔结点也被加以同样类型的锁。意向锁的含义是如果对一个结点加意向锁,则说明该节点的下层结点正在被加锁;对仁义结点加锁是,必须先对它的上层结点加意向
12、锁。第十四章 分布式数据库1. 试述分布式数据库的概念和特点。分布式数据库由一组数据组成,这组数据分布在计算机网络的不同计算机上,网络中的每个节点具有独立处理的能力,可以执行局部应用。同时,每个结点也能通过而网络通信系统执行全局应用。这个定义强调了分布式数据库系统的场地自治性和自治场地之间的协作性。2. 试述分布式数据库系统的模式结构和分布式透明性的概念集中式数据库的许多概念和技术,如数据独立性、数据共享和数据冗余、并发控制、完整性、安全性和恢复等,在分布式数据库系统中都有了新的更加丰富的内容。3. 试述什么是数据分片及其主要的方法。MTU 是指一个特定的网络所允许的物理帧的最大数据量,当路由器收到一个大于其要转发的网络的 MTU 的数据包时,路由器必须将这个数据报分成可通过该网络的数据报片,每一片仍采用数据报的格式,且保留原数据的标识符,但只包含原数据报的部分数据,在需要时,数据报片可以再次分片。