1、6.数据库恢复技术v事务的基本概念v数据库恢复概述v故障的种类v恢复的实现技术v恢复策略事务的基本概念v 一、事务 (Transaction)v 事务是用户定义的一个操作序列,这些操作要么全做要么全不做,是一个不可分割的工作单位,是数据库环境中的逻辑工作单位。v 事务和程序是两个概念,一般程序包含多个事务。v 事务的开始与结束可以由用户显式控制。如果用户没有显式地定义事务,则由 DBMS按缺省规定自动划分事务。在 SQL语言中,定义事务的语句有三条:v BEGIN TRANSACTION 事务开始v v COMMIT 事务提交v ROLLBACK 事务回滚v 举例 2:显式事务(回滚)v 在一
2、个 sql批文件中,若在一个显式事务中删除数据表SC,然后回滚事务,其删除无效。v 举例 3:显式事务(提交)v 在一个 sql批文件中,若在一个显式事务中删除数据表 SC,然后提交事务,其删除有效。v 二、事务的特性v 事务具有四个特性,简称 ACID特性。v A 原子性 (Atomicity)v 事务是数据库的逻辑工作单位,事务中包括的诸操作要么都做,要么都不做。v B 一致性 (Consistency)v 事务执行的结果必须是使数据库从一个一致性状态变到另一个一致性状态。因此当数据库只包含成功事务提交的结果时,就说数据库处于一致性状态。如果数据库系统运行中发生故障,有些事务尚未完成就被迫
3、中断,系统将事务中对数据库的所有已完成的操作全部撤消,滚回到事务开始时的一致状态。v C 隔离性 (Isolation)v 一个事务的执行不能被其他事务干扰。即一个事务内部的操作及使用的数据对其他并发事务是隔离的,并发执行的各个事务之间不能互相干扰。v D 持续性 (Durability)v 持续性也称永久性( Permanence),指一个事务一旦提交,它对数据库中数据的改变就应该是永久性的。接下来的其他操作或故障不应该对其执行结果有任何影响。v 三、事务与恢复和并发控制的关系v 事务是恢复和并发控制的基本单位。保证事务 ACID特性是事务处理的重要任务。事务 ACID特性可能遭到破坏的因素
4、有:v 1. 多个事务并行运行时,不同事务的操作交叉执行。v 2. 事务在运行过程中被强行停止。v 在第一种情况下,数据库管理系统必须保证多个事务的交叉运行不影响这些事务的原子性。在第二种情况下,数据库管理系统必须保证被强行终止的事务对数据库和其它事务没有任何影响。v 这些就是数据库管理系统中恢复机制和并发控制机制的责任数据库恢复概述 v 尽管数据库系统中采取了各种保护措施来防止数据库的安全性和完整性被破坏,保证并发事务的正确执行,但是计算机系统中硬件的故障、软件的错误、操作员的失误以及恶意的破坏仍是不可避免的,这些故障轻则造成运行事务非正常中断,影响数据库中数据的正确性,重则破坏数据库,使数
5、据库中全部或部分数据丢失,因此 数据库管理系统必须具有把数据库从错误状态恢复到某一已知的正确状态(亦称为一致状态或完整状态)的功能,这就是数据库的恢复 。故障的种类v 数据库系统中可能发生各种各样的故障,大致可以分为四类:v 一、事务内部的故障v 事务内部的故障有的是可以通过事务程序本身发现的 (见下面转帐事务的例子),有的是非预期的,不能由事务程序处理的。v 举例:银行转帐事务v 该事务把一笔金额从一个帐户甲转给另一个帐户乙。v BEGIN TRANSACTIONv 读帐户甲的余额 BALANCE; v BALANCE = BALANCE-AMOUNT; -AMOUNT 为转帐金额v IF(
6、BALANCE0) THEN v 打印 金额不足,不能转帐 ; v ROLLBACK; -撤消该事务v v ELSE v 读帐户乙的余额 BALANCE1; v BALANCE1 = BALANCE1+AMOUNT; v 写回 BALANCE1; v COMMIT; -提交该事务v v 事务内部更多的故障是非预期的,是不能由应用程序处理的。如运算溢出、并发事务发生死锁而被选中撤消该事务、违反了某些完整性限制等。以后,事务故障仅指这类非预期的故障。v 事务故障意味着事务没有达到预期的终点( COMMIT或者显式的 ROLLBACK),因此,数据库可能处于不正确状态。恢复程序要在不影响其它事务运行
7、的情况下,强行回滚(ROLLBACK)该事务,即撤消该事务已经作出的任何对数据库的修改,使得该事务好象根本没有启动一样。这类恢复操作称为事务撤消( UNDO)。v 二、系统故障v 系统故障是指造成系统停止运转的任何事件,使得系统要重新启动,通常称为软故障 (Soft Crash)。v 例如,特定类型的硬件错误( CPU故障)、操作系统故障、DBMS代码错误、突然停电等等。这类故障影响正在运行的所有事务,但不破坏数据库。这时主存内容,尤其是数据库缓冲区(在内存)中的内容都被丢失,所有运行事务都非正常终止。发生系统故障时,一些尚未完成的事务的结果可能已送入物理数据库,有些已完成的事务可能有一部分甚至全部留在缓冲区,尚未写回到磁盘上的物理数据库中,从而造成数据库可能处于不正确的状态。为保证数据一致性,恢复子系统必须在系统重新启动时让所有非正常终止的事务回滚,强行撤消( UNDO)所有未完成事务。重做( Redo)所有已提交的事务,以将数据库真正恢复到一致状态。v