OCA读书笔记(16)

16. Performing Database Recovery

确定执行恢复的必要性
访问不同接口(EM以及命令行)
描述和使用可用选项，如RMAN和Data Recovery Advisor
执行恢复
-控制文件(control file)
-重做日志文件(redo log file)
-数据文件(data file)

打开数据库
NoMount: 从ShutDown->NoMount, 读取初始化参数文件(pfile)，不检查数据库文件
Mount: 从NoMount->Mount，检查参数文件中所列的控制文件是否存在并且同步，任一控制文件丢失，实例均会返回错误并且保持在NoMount状态
Open: 从Mount->Open，检查控制文件中所列的重做日志组是否至少存在一组，任何丢失的日志组成员均会被记录到警告日志；检查控制文件中所列的没有offline的数据文件是否存在，如果有文件丢失，会报告包含第一个丢失的文件信息的错误，需要检查v$recover_file获取所有丢失的文件
SQL> SELECT name, error
2 FROM v$datafile
3 JOIN v$recover_file
4 USING (file#);

保持数据库在打开状态
介质错误会导致实例错误：如丢失控制文件，丢失重做日志文件的一个组(即使是inactive的组)或者丢失属于SYSTEM和UNDO表空间的一个数据文件
很多时候，实例错误必能全完关闭数据库，在进行恢复之前，需要管理员应用SHUTDOWN ABORT命令

Data Recovery Advisor当前仅支持单实例，不支持RAC。
rman target /
rman> list failure all;

V$IR_FAILURE: Listing of all failures, including closed ones (result of the LIST FAILURE command)
V$IR_MANUAL_CHECKLIST: Listing of manual advice (result of the ADVISE FAILURE command)
V$IR_REPAIR: Listing of repairs (result of the ADVISE FAILURE command)
V$IR_FAILURE_SET: Cross-reference of failure and advise identifiers

数据库恢复
1.丢失一份控制文件
如果控制文件存储在ASM磁盘组，恢复选项如下：
1).使用EM根据向导执行恢复
2).将数据库置于NoMount模式，然后应用RMAN从现有控制文件中恢复
RMAN> restore controlfile from '+DATA/orcl/controlfile/current.260.695209463';
如果控制文件存储在普通文件系统
1).关闭数据库
2).拷贝现有控制文件来替代丢失的控制文件
当控制文件成功恢复之后，打开数据库

2.丢失某重做日志文件组中的一份重做日志文件
从文件组中删除文件，然后重新添加文件
SQL> ALTER DATABASE DROP LOGFILE MEMBER '+DATA/orcl/onlinelog/group_1.261.691672257';
SQL> ALTER DATABASE ADD LOGFILE MEMBER '+DATA' TO GROUP 2;
清空日志组以重建丢失的文件
SQL> ALTER DATABASE CLEAR LOGFILE GROUP #;
SQL> ALTER DATABASE CLEAR UNARCHIVED LOGFILE GROUP #;

3.在非归档模式下丢失一份数据文件
1).如果数据库没有关闭，则关闭数据库
2).从备份中恢复整个数据库，包括所有数据文件和控制文件
3).打开数据库
4).让用户重新录入自从上次备份以来所做的改变

4.在归档模式下丢失一份非关键数据文件
在归档模式下，丢失不属于SYSTEM和UNDO表空间的数据文件，仅影响所在数据文件的对象。
1).在EM的维护页面点击执行恢复
2).选择数据文件作为恢复类型(Object Type)，然后选择"Restore to current time"
3).添加所有需要恢复的数据文件
4).决定恢复的数据文件位于默认位置或者新的位置(在硬盘或者控制文件丢失的情况下)
5).提交RMAN操作以恢复丢失的文件

实验：普通表空间，比如users，文件丢失的恢复

模拟损坏：
[oracle@oracle ~]$ sqlplus scott/tiger
create table e as select * from emp;

!rm -rf /u01/app/oracle/oradata/orcl/users01.dbf
select * from e;

conn /as sysdba
alter system flush buffer_cache;

conn scott/tiger
select * from e;

conn /as sysdba
alter database datafile 4 offline;

!cp -v /u01/app/oracle/backup/hotbk/users01.dbf /u01/app/oracle/oradata/orcl
recover datafile 4;

alter database datafile 4 online;

conn scott/tiger
select * from e;

发现e表没有丢失，完全恢复

实验：未备份的数据文件丢失的恢复

conn /as sysdba
create tablespace t datafile '/u01/app/oracle/oradata/orcl/t01.dbf' size 1M;

conn scott/tiger
create table t tablespace t as select * from dept;

!rm -rf /u01/app/oracle/oradata/orcl/t01.dbf

SQL>conn /as sysdba
SQL>alter system flush buffer_cache;

SQL>alter database datafile 6 offline;
SQL>alter database create datafile 6;--根据控制文件创建数据文件

SQL>select creation_change# from v$datafile where file#=6;--发现恢复的起点是这个文件的创建scn

SQL>recover datafile 6;--直接应用联机redo进行恢复
SQL>select group#, sequence#, status, first_change# from v$log;

SQL>select checkpoint_change# from v$datafile_header where file#=6;
SQL>select checkpoint_change#, last_change# from v$datafile where file#=6;

SQL>alter database datafile 6 online;--一致，online成功

5.在归档模式下丢失一份关键数据文件
1).如果数据库没有关闭，关闭数据库(SHUTDOWN ABORT)
2).Mount数据库
3).执行4中的相同步骤以恢复丢失的文件
4).打开数据库

实验： system表空间的数据文件丢失

模拟破坏：

sqlplus / as sysdba
create table big_t as select * from dba_objects;

!rm -rf /u01/app/oracle/oradata/orcl/system01.dbf
alter system flush buffer_cache;

恢复：关闭数据库，启动到mount：由于不能正常关闭，只能杀进程：
[oracle@oracle u01]$ ps -ef | grep dbw
oracle 4410 1 0 08:20 ? 00:00:00 ora_dbw0_orcl
oracle 4620 4478 0 08:27 pts/2 00:00:00 grep dbw
[oracle@oracle u01]$ kill -9 4410

startup
select file#,error,change#,time from v$recover_file;

查看检查点scn：
ORA10G>select checkpoint_change#, last_change# from v$datafile where file#=1;
ORA10G>select checkpoint_change# from v$datafile_header where file#=1;

将system表空间的备份拷贝至文件所在的位置：
!cp -v /u01/app/oracle/backup/hotbk/system01.dbf /u01/app/oracle/oradata/orcl
alter database open; --error

select checkpoint_change#, last_change# from v$datafile where file#=1;
select checkpoint_change# from v$datafile_header where file#=1;
CHECKPOINT_CHANGE#
------------------
1162060

通过备份点找到恢复时应用的第一个归档日志文件：

ORA10G>select name from v$archived_log where 1162060 between FIRST_CHANGE# and NEXT_CHANGE#;

NAME
--------------------------------------------------------------------------------
/u01/app/oracle/archivelog/1_59_816604382.dbf

recover datafile 1;
auto

alter database open;

select count(*) from big_t;

发现big_t仍然存在，是完全恢复

实验：undo表空间文件丢失的恢复

模拟损坏：
create table e as select * from emp;
!rm -rf /u01/app/oracle/oradata/orcl/undotbs01.dbf

conn /as sysdba
alter system flush buffer_cache;

conn scott/tiger
update e set sal=sal+100;

关闭数据库并启动到Mount
conn /as sysdba
shutdown abort
startup mount

将数据文件拷回相应位置
!cp -v /u01/app/oracle/backup/hotbk/undotbs01.dbf /u01/app/oracle/oradata/orcl/

恢复数据文件
recover datafile 2;
auto

alter database open;
conn scott/tiger
select * from tab;

实验：所有数据文件全部丢失

模拟损坏：
SQL>conn scott/tiger
create table e as select * from emp;
SQL>exit

[oracle@oracle ~]$ cd $ORACLE_BASE/oradata/orcl
[oracle@oracle orcl]$ rm -rf *dbf

[oracle@oracle orcl]$ sqlplus / as sysdba
SQL>alter system flush buffer_cache;
SQL>conn scott/tiger
SQL>exit

[oracle@oracle orcl]$ ps -ef | grep dbw
oracle 5056 1 0 08:46 ? 00:00:00 ora_dbw0_orcl
oracle 15510 14808 0 10:40 pts/1 00:00:00 grep dbw
[oracle@oracle orcl]$ kill -9 5056

[oracle@oracle orcl]$ sqlplus / as sysdba
SQL>startup

SQL>!cp -v /u01/app/oracle/backup/hotbk/*dbf /u01/app/oracle/oradata/orcl
SQL>recover database;--开始恢复
auto

SQL>select file#,error,change# from v$recover_file;

SQL>select checkpoint_change#,last_change# from v$datafile;
SQL>select checkpoint_change# from v$datafile_header;

SQL>alter database open;--因为一致了，所以打开了

SQL>conn scott/tiger
SQL>select * from e;

6. 不完全恢复

实验：基于scn的不完全恢复：

首先模拟损坏：
conn scott/tiger
drop table emp purge;

首先通过日志挖掘，找到误删除的时间点
select 'execute dbms_logmnr.add_logfile('''||member||''')' from v$logfile

SQL>execute dbms_logmnr.add_logfile('/u01/app/oracle/oradata/orcl/redo03.log')
execute dbms_logmnr.add_logfile('/u01/app/oracle/oradata/orcl/redo02.log')
execute dbms_logmnr.add_logfile('/u01/app/oracle/oradata/orcl/redo01.log')

启动挖掘：
execute dbms_logmnr.start_logmnr();

查询误删除的scn：
select SCN,SQL_REDO from v$logmnr_contents where SEG_OWNER='SCOTT' AND TABLE_NAME='EMP' and sql_redo like '%drop table emp%';

SQL>shutdown immediate
SQL>startup mount;

SQL>!cp -v /u01/app/oracle/backup/hotbk/*dbf /u01/app/oracle/oradata/orcl--拷贝所有数据文件的备份：
SQL>recover database until change 1236777 --将数据库恢复到误操作的前一时刻
auto

SQL>alter database open resetlogs;

实验：基于cancel的不完全恢复

[oracle@oracle ~]$ sqlplus / as sysdba

SQL>shutdown abort
SQL>startup mount;

SQL>!cp -v /u01/app/oracle/backup/hotbk/*dbf /u01/app/oracle/oradata/orcl

SQL>recover database;--此时进行完全恢复，但是当前日志丢失，所以不能进行完全恢复
auto

SQL>recover database until cancel--实施基于cancel的不完全恢复，数据库只能恢复到丢失的日志
cancel

SQL>alter database open resetlogs;--要以resetlogs的方式打开数据库，发现日志没了，oracle会以控制文件记录的日志文件重建日志文件

实验：使用备份的控制文件的不完全恢复
主要是针对于误删除表空间的不完全恢复：

1）使用现有控制文件进行恢复：

模拟损坏：
SQL>create tablespace tt datafile '/u01/app/oracle/oradata/orcl/tt01.dbf' size 1M;
SQL>conn scott/tiger
SQL>create table tt tablespace tt as select * from dept;

执行全备：
[oracle@oracle u01]$ ./userback.sh

[oracle@oracle u01]$ sqlplus / as sysdba
SQL>drop tablespace tt including contents and datafiles;
SQL>alter system switch logfile;

select 'execute dbms_logmnr.add_logfile('''||member||''')' from v$logfile

SQL>exec dbms_logmnr.start_logmnr();
select SCN,SQL_REDO from v$logmnr_contents where sql_redo like '%drop%';
485780

SQL>shutdown immediate
SQL>startup mount

SQL>!cp -v /u01/backup/hotbk/*dbf /u01/app/oracle/oradata/orcl
SQL>recover database until change 485780
auto

SQL>alter database open resetlogs;

SQL>conn /as sysdba
SQL>select tablespace_name,file_name from dba_data_files;

发现tt表空间的文件名已经于之前不一样，因为tt表空间被删除了，控制文件中没有tt表空文件的记录
所以在恢复的过程中oracle自定义了tt表空间文件的名称

需要重新对tt表空间的文件进行命名：
SQL>alter tablespace tt rename datafile '/u01/app/oracle/product/11.2/db_1/dbs/MISSING00006' to '/u01/app/oracle/oradata/orcl/tt01.dbf';

SQL>alter tablespace tt offline;--此时需要恢复

SQL>recover datafile 6;
auto

SQL>alter tablespace tt online;

2）使用备份的控制文件进行恢复：

重新对数据库做备份：
./userback.sh

SQL>drop tablespace tt including contents and datafiles;
SQL>select 'execute dbms_logmnr.add_logfile('''||member||''')' from v$logfile

SQL>exec dbms_logmnr.start_logmnr();
SQL>select SCN,SQL_REDO from v$logmnr_contents where sql_redo like '%drop%';
486128

SQL>shutdown immediate
SQL>startup nomount

SQL>!cp /u01/app/oracle/backup/hotbk/control.bak /u01/app/oracle/oradata/orcl/control01.ctl
SQL>!cp /u01/app/oracle/backup/hotbk/control.bak /u01/app/oracle/oradata/orcl/control02.ctl
SQL>!cp /u01/app/oracle/backup/hotbk/control.bak /u01/app/oracle/oradata/orcl/control03.ctl

SQL>alter database mount;
SQL>!cp -v /u01/app/oracle/backup/hotbk/*dbf /u01/app/oracle/oradata/orcl

SQL>recover database until change 486128 using backup controlfile
auto

SQL>recover database until change 486128 using backup controlfile
cancel

SQL>alter database open resetlogs;
SQL>select tablespace_name,file_name from dba_data_files;