数据库复习重点概念.docx

上传人:h**** 文档编号:777060 上传时间:2018-10-31 格式:DOCX 页数:11 大小:437.97KB
下载 相关 举报
数据库复习重点概念.docx_第1页
第1页 / 共11页
数据库复习重点概念.docx_第2页
第2页 / 共11页
数据库复习重点概念.docx_第3页
第3页 / 共11页
数据库复习重点概念.docx_第4页
第4页 / 共11页
数据库复习重点概念.docx_第5页
第5页 / 共11页
点击查看更多>>
资源描述

1、1. 数据管理的几个阶段及其对比1 人工管理阶段2.文件系统阶段3.数据库系统阶段2. 数据库三级模式外模式、模式、内模式。外模式又称子模式或用户模式,对应于用户级。它是某个或某几个用户所看到的数据库的数据视图,是与某一应用有关的数据的逻辑表示。模式又称概念模式或逻辑模式,对应于概念级。它是由数据库设计者综合所有用户的数据,按照 统一的观点构造的全局逻辑结构,是对数据库中全部数据的逻辑结构和特征的总体描述。内模式又称存储模式,对应于物理级,它是数据 库中全体数据的内部表示或底层描述,是数据 库最低一级的逻辑描述,它描述了数据在存储介质上的存储方式和物理结构,对应着实际存储在外存储介质上的数据库

2、。3. 物理数据独立性和逻辑数据独立性物理独立性是指用户的应用程序与存储在磁盘上的数据库中数据是相互独立的。即,数据在磁盘上怎样存储由 DBMS 管理,用 户程序不需要了解,应用程序要处理的只是数据的逻辑结构,这样当数据的物理存储改变了,应用程序不用改变。逻辑独立性是指用户的应用程序与数据库的逻辑结构是相互独立的,即,当数据的逻辑结构改变时,用户程序也可以不变。4. DB、DBMS、DBSDB:Database 数据库:数据库(Database)是按照数据结构来组织、存 储和管理数据的建立在计算机存储设备上的仓库。DBMS:数据库管理系统:数据库管理系统(Database Management

3、 System)是一种操纵和管理数据库的大型软件,用于建立、使用和 维护数据库, 简称 DBMSDBS:数据 库系 统:DBS 即 Database System,中文意 为“数据库系统”,是指带有数据库并利用数据库技术进行数据管理的计算机系统。数据库系统 DBS 一般由 4 个部分 组成:数据库,即存储在磁带、磁盘、光 盘或其他外存介质上、按一定结构组织在一起的相关数据的集合。数据库管理系统(DBMS)。它是一组能完成描述、管理、维护数据库的程序系统。它按照一种公用的和可控制的方法完成插入新数据、修改和检索原有数据的操作。数据库管理员(DBA)。用户和应用程序。5. DBMS 的功能数据定义

4、;数据操作;数据库的运行管理;数据组织、存储与管理;数据库的保护;数据库的维护;通信。6. 数据库管理系统的组成、主要模块:存储管理和事务处理查询处理器:DDL 编译器、DML 编译器、嵌入式 DML 的预编译器和查询运行核心程序。存储管理器:权限和完整性管理器、事物管理器、文件管理器和缓冲区管理器。7. DBA 及其作用DBA 是对系统进行集中控制的人,被称为数据库管理员。主要作用有:模式定义;存储结构及存取方法定义;模式及物力组织的修改;数据访问授权;日常维护。8. 数据模型(概念模型、结构模型)概念模型;逻辑模型;物理模型。概念模型(Conceptual Data Model),是面向数

5、据 库用户的现实世界的模型,主要用来描述世界的概念化结构。在概念数据模型中最常用的是 E-R 模型、 扩 充的 E-R 模型、面向对象模型及谓词模型。逻辑模型(Logical Data Model), 这是用户从数据库所看到的模型,是具体的 DBMS 所支持的数据模型,如网状数据模型(Network Data Model)、层次数据模型(Hierarchical Data Model)等等。此模型既要面向用户,又要面向系统,主要用于数据库管理系统(DBMS)的实现。物理模型(Physical Data Model),是面向计算机物理表示的模型,描述了数据在储存介质上的组织结构,它不但与具体的

6、DBMS 有关,而且还与操作系统和硬件有关。9. 关系模式关系的描述称为关系模式(Relation Schema)通常简记为: R(U)或 R(A1,A2,,An) 其中 R 为关系名,U 为属性名集合, A1,A2,An 为各属性名。10.超码、候选码、主码超码是一个或多个属性的集合,这些属性可以让我们在一个实体集中唯一地标识一个实体。如果K 是一个超码,那么 K 的任意超集也是超码,也就是 说 如果 K 是超码,那么所有包含 K 的集合也是超码。候选码是从超码中选出的,自然地候选码也是一个或多个属性的集合。因为超码的范围太广,很多是我们并不感兴趣即无用处的。所以候选码是最小超码,它们的任意

7、真子集都不能成为超码。主码:从多个候选码中任意选出一个做为主码,如果候选码只有一个,那么候选码就是主码。11.强实体、弱实体及其区别其定义为一个实体对于另一个实体(一般为强实体,也可以是依赖于其他强实体的弱实体)具有很强的依赖联系,而且该实体主 键的一部分或全部从其强实体(或者对应的弱实体依赖的强实体)中获得,则称该实体为弱实体。注:在现实世界中,有时某些实体对于另一些实体有很强的依赖关系,即一个实体的存在必须以另一实体的存在为前提。前者就称为“弱实体”,后者称为“ 强实体”。比如在人事管理系统中,职工子女的信息就是以职工的存在为前提的,子女实体是弱实体,子女与职工的联系是一种依赖联系。表示方

8、法:在 ER 模型中也称(实体-联系图(Entity Relationship Diagram),弱 实体用双线矩形框表示。与弱实体的联系用双线菱形框表示。注意:强实体与弱实体的联系只能是 1:1 或 1:N。弱实体参与联系时应该是“ 完全参与”,因此弱实体与联系间的联系也画成双线边。12.关系代数基本操作:选择、投影、并、差、笛卡尔乘积、更名运算。附加的关系代数运算:集合交、连接( 连接、自然连接)、除、赋值。拓展的关系代数:广义投影、聚集函数、外 连接。13.自然连接、外连接及其适用场合自然连接:在连接运算当中,一种最常用的连接是自然连接。如果关系 R 与 S 具有相同的属性组B,且该 属

9、性组的值相等时的连接称为自然连接, 。结果关系的属性集合为 R 的属性并上 S 减去属性 B的属性集合 R 和 S 自然连接可记作:RS=t rts |tr RtsStrA=tsB自然连接也可看作是在广义笛卡尔积 RS 中选出同名属性上符合相等条件元 组,再 进行投影,去掉重复的同名属性,组成新的关系。外连接:如果把舍弃的元组也保存在结果关系中,而在其他属性上空值,那么这种连接就叫外连接。如果只把左边关系 R 要舍弃的元组保留就叫左外连接,如果只把右边关系 S 中要舍弃的元组保留右外连接。自然连接与等值连接的区别1. 等值连接中不要求相等属性值的属性名相同,而自然连接要求相等属性值的属性名必须

10、相同,即两关系只有在同名属性才能进行自然连接。2. 等值连接不将重复属性去掉,而自然连接去掉重复属性,也可以说,自然 连接是去掉重复列的等值连接。14.视图及其作用视图是从一个或几个基本表(或视图)导出的表。它与基本表不同,是一个虚表。数据库只存放视图的定义,而不存放视图对应 的数据, 这些数据仍存放在原来的基本表中。视图的作用1. 视图能够简化用户的操作2. 视图使用户能以多种角度看待同一数据 3. 视图对重构数据库提供了一定程度的逻辑独立性 4. 视图能够对机密数据提供安全保护5. 适当的利用视图可以更清晰的表达查询。15.SQL 标准的发展SQL-86:“数据 库语言 SQL”SQL-8

11、9:“具有完整性增 强的数据 库语言 SQL”,增加了对完整性约束的支持SQL-92:“数据 库语言 SQL”,是 SQL-89 的超集,增加了许多新特性,如新的数据类型,更丰富的数据操作,更强的完整性、安全性支持等。SQL-3(99 年):新的标准,增加对面向对象模型的支持16.DDL、DML、DCLDDL(Data Definition Language 数据定义语言)用于操作对象和对象的属性,这种对象包括数据库本身,以及数据库对象,像:表、视图等等,DDL 对这些 对象和属性的管理和定义具体表现在Create、Drop 和 Alter 上。DML(Data Manipulation La

12、nguage 数据操控语言)用于操作数据库对象中包含的数据,也就是说操作的单位是记录。如 insert、update、delete 等对记录的操作。DCL(Data Control Language 数据控制语句)的操作是数据 库对象的权限,这些操作的确定使数据更加的安全。17.嵌入式 SQL、宿主 语言嵌入式 SQL(英文: Embedded SQL)是一种将 SQL 语句直接写入 C 语言等编程语言源代码中的方法。借此方法,可使得应用程序 拥有了访问数据以及处理数据的能力。在这一方法中,将 SQL 文嵌入的目标源码的语言称为宿主语言。18.ODBC、JDBC开放数据库连接(Open Dat

13、abase Connectivity,ODBC)JDBC(Java Data Base Connectivity,java 数据库连接)是一种用于执行 SQL 语句的 Java API,可以为多种关系数据库提供统一访问,它由一组用 Java 语言编写的类和接口组成。19.数据库完整性及其主要措施数据库完整性(Database Integrity)是指数据库中数据的正确性和相容性,要防止不合语义的数据进入数据库。保证数据库完整性的措施主要有:完整性约束、触发器。完整性约束包括:非空约束、主键约束、 check 约束、唯一约束、参照完整性约束、断言。20.触发器及其功能触发器是一种特殊的存储过程,

14、它在试图更改触发器所保护的数据时自动执行触发器有如下作用:可在写入数据表前,强制检验或转换数据。触发器发生错误时,异动的结果会被撤销。部份数据库管理系统可以针对数据定义语言(DDL)使用触发器,称为 DDL 触发器。可依照特定的情况,替换异动的指令 (INSTEAD OF)。21.数据库安全性及其主要措施数据库安全性:保护数据库,防止不合法的使用造成的数据泄露、更改或破坏。22.范式、各范式之间的关系范式是符合某一种级别的关系模式的集合。关系数据库中的关系必须满足一定的要求,满足不同程度要求的为不同范式第一范式:第一范式是为了要排除 重复组 的出现,所采用的方法是要求数据库的每个列的值域都是由

15、原子值组成;每个字段的值都只能是单一值。第二范式:它的规则是要求数据表里的所有数据都要和该数据表的键(主键与候选键)有完全依赖关系:每个非键属性必须独立于任意一个候选键的任意一部分属性。第三范式:要求所有非键属性都只和候选键有相关性,也就是说非键属性之间应该是独立无关的。BCNF:BCNF 与第三范式的不同之处在于:第三范式中不允许非主属性被另一个非主属性决定,但第三范式允许主属性被非主属性决定;而在 BCNF 中,任何属性(包括非主属性和主属性)都不能被非主属性所决定。任何一个 BCNF 必然满足:所有非主属性都完全函数依赖于每个候选键所有主属性都完全函数依赖于每个不包含它的候选键没有任何属

16、性完全函数依赖于非候选键的任何一组属性23.函数依赖:完全依赖、部分依赖、传递依赖、多值依赖完全函数依赖:设 X,Y 是关系 R 的两个属性集合,X是 X 的真子集,存在 XY,但 对每一个 X都有 X!Y,则 称 Y 完全函数依赖于 X。部分函数依赖:设 X,Y 是关系 R 的两个属性集合,存在 XY,若 X是 X 的真子集,存在 XY,则称 Y 部分函数依赖于 X。传递函数依赖:设 X,Y,Z 是关系 R 中互不相同的属性集合,存在 XY(Y !X),YZ,则称 Z 传递函数依赖于 X。多值函数依赖:设 R(U)是一个属性集 U 上的一个关系模式, X、 Y 和 Z 是 U 的子集,并且Z

17、U XY。关系模式 R(U)中多值依赖 XY 成立,当且仅当对 R(U)的任一关系 r,给定的一对(x,z)值,有一 组 Y 的值,这组值仅仅决定于 x 值而与 z 值无关平凡函数依赖:当关系中属性集合 Y 是属性集合 X 的子集时(Y X),存在函数依赖 XY,即一组属性函数决定它的所有子集,这种函数依赖称为平凡函数依赖。非平凡函数依赖:当关系中属性集合 Y 不是属性集合 X 的子集时,存在函数依赖 XY,则称这种函数依赖为非平凡函数依赖。24.规范化的主要目的:消除冗余使结构合理,使数据冗余尽量小,清除插入,删除和更新异常.25.无损连接分解、无损链接分解:关系模式 R的一个分解 = R1

18、,R2, ,Rn若 R 与R1、R2、Rn 自然连接的结果相等, 则称关系模式 R 的这个分解 具有无损连接性(Lossless join)保持函数依赖分解:设关系模式 R被分解为若干个关系模式R1,R2,Rn(其中 U=U1U2Un,且不存在 Ui Uj,Fi 为 F 在 Ui 上的投影),若 F 所逻辑蕴含的函数依赖一定也由分解得到的某个关系模式中的函数依赖 Fi 所逻辑蕴含,则称关系模式 R 的这个分解是保持函数依赖的(Preserve dependency)。26.索引在关系数据库中,索引是一种单独的、物理的数 对数据库表中一列或多列的值进行排序的一种存储结构,它是某个表中一列或若干列

19、值的集合和相应的指向表中物理标识这些值的数据页的逻辑指针清单。索引的作用相当于图书 的目录,可以根据目 录中的 页码快速找到所需的内容。27.建立索引的优缺点优点:通过创建唯一索引,可以保证数据记录的唯一性。可以大大加快数据检索速度。可以加速表与表之间的连接,这一点在实现数据的参照完整性方面有特别的意义。在使用 ORDER BY 和 GROUP BY 子句中进行检索数据时,可以显著减少查询中分组和排序的时间。缺点:但过多的索引会多耗费空间,且降低了插入、 删除、更新的效率。28.主索引、辅助索引主索引:在顺序排序的文件中,搜索键指定文件的顺序的索引。也称为聚类索引,主索引的搜索 键通常但不一定

20、是主键。辅助索引:搜索键指定与文件顺序不同的顺序的索引。 也称为非聚类索引。29.稠密索引、稀疏索引稠密索引 - 对 文件中的每个搜索键值显示索引记录。稀疏索引 - 某些搜索 键值的索引记录。30.查询处理、查询处理的一般过程第一步:语法分析和翻译;第二步:优化查询;第三步:执行查询31.决定查询代价的主要因素磁盘读写;CPU;内存;网络。32.查询优化的目的及一般原则查询优化:对于给定的查询选择代价最小的操作序列,使查询过程既省时间,具有较高的效率, 这就是所谓的查询优化。一般原则1) 选择运算尽早进行。在优化策略中这是最重要、最基本的一条。它常常可使执行时节约几个数量级,因为选择运算一般使

21、计算的中间结果大大变小。2) 投影运算尽早进行 。3) 投影运算与选择运算可同时进行。如有若干投影和选择运算,并且它们都对同一个关系操作,则可以在扫描此关系的同时完戌所有的这些运算以避免重复扫描关系。4) 将笛卡儿积与随后的选择运算合并为连接运算。5) 投影运算与其他运算同时进行。33.事务以及事务的 ACID 性质事务(Transaction)是访问并可能更新数据库中各种数据项的一个程序执行单元(unit)原子性:一个事务(transaction)中的所有操作,要么全部完成,要么全部不完成,不会结束在中间某个环节。事务在执行过程中 发生错误,会被回 滚(Rollback)到事务开始前的状态,

22、就像这个事务从来没有执行过一样。一致性:在事务开始之前和事务结束以后,数据库的完整性没有被破坏。这表示写入的资料必须完全符合所有的预设规则,这 包含资料的精确度、串 联性以及后续数据库可以自发性地完成预定的工作。隔离性:数据库允许多个并发事务同时对齐数据进行读写和修改的能力,隔离性可以防止多个事务并发执行时由于交叉执行而导致数据的不一致。事务隔离分为不同级别,包括读未提交(Read uncommitted)、读提交(read committed)、可重复 读(repeatable read)和串行化(Serializable)。持久性:事务处理结束后,对数据的修改就是永久的,即便系统故障也不会

23、丢失。34.事务的主要状态35.并行调度在并行调度中,来自不同事务的指令可以交叉执行;当并行调度等价于某个串行调度时,则称它是正确的36.并行调度有可能引起的问题(重点:丢失修改)丢失修改;读脏数据;不能重复读37.可串行性的并行调度每个事务中,语句的顺序在各种调度中始终保持一致。在这个前提下,如果一个并 发调度的执行结果与某一串行调度的执行结果等价,则称该并发调度为“ 可串行化调度”,否则称为“ 不可串行化调度”。38.封锁并发控制的主要技术是封锁(Locking)。某事务对某个数据操作之前,先对其加锁,其他事 务不能更新加锁的数据,直到 释放封锁为止39.死锁及其解决办法Deadlock(

24、死锁):两个事务处 于相互等待状态,永 远不能结束。解决方法:撤销不重要的事务。死锁的预防一次封锁法:要求每个事务必须一次将所有要使用的数据全部加锁,否则就不能继续执行。顺序封锁法:预先对数据对象规定一个封锁顺序,所有事务都按这个顺序实行封锁。40.独占锁(或排他锁)和共享锁(1) 排他锁(X 锁或 WLOCK) 某事务对数据加上排他锁,该事务可读写数据,其他事务不能再对数据加任何类型的锁,也就不能 读写该数据,只有等待开锁(2) 共享锁 (S 锁或 RLOCK)1.允许其他事务对同一数据进行检索,但不得对同一数据进行修改操作2.若事务 T 对数据对象 A 加上 S 锁,则事务可以 T 读 A 但不能修改 A,其它事务只能再对 A 加 S锁,而不能加 X 锁,直到 T 释放 A 上的 S 锁。这就保证 了其它事务可以读 A,但在 T 释放 A 上的 S 锁之前不能对 A 做任何修改。

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 教育教学资料库 > 参考答案

Copyright © 2018-2021 Wenke99.com All rights reserved

工信部备案号浙ICP备20026746号-2  

公安局备案号:浙公网安备33038302330469号

本站为C2C交文档易平台,即用户上传的文档直接卖给下载用户,本站只是网络服务中间平台,所有原创文档下载所得归上传人所有,若您发现上传作品侵犯了您的权利,请立刻联系网站客服并提供证据,平台将在3个工作日内予以改正。