日前在整理数据库表空间的是否,发现最大的数据文件来自回滚段。回滚段文件undotbs1的数据文件已经达到23G。
希望清理这部分数据,但一时又无从下手。于是决定深入了解一下这部分内容。
法和规划及问题的解决。 回滚段概述 回滚段用于存放数据修改之前的值(包括数据修改之前的位置和值)。回滚段的头部包含正在使用的该回滚段事务的信息。一个事务只能使用一个回滚段来存放它的回滚信息,而一个回滚段可以存放多个事务的回滚信息。 回滚段的作用 事务回滚:当事务修改表中数据的时候,该数据修改前的值(即前影像)会存放在回滚段中,当用户回滚事务(ROLLBACK)时,ORACLE将会利用回滚段中的数据前影像来将修改的数据恢复到原来的值。 事务恢复:当事务正在处理的时候,例程失败,回滚段的信息保存在重做日志文件中,ORACLE将在下次打开数据库时利用回滚来恢复未提交的数据。 读一致性:当一个会话正在修改数据时,其他的会话将看不到该会话未提交的修改。而且,当一个语句正在执行时,该语句将看不到从该语句开始执行后的未提交的修改(语句级读一致性)。当ORACLE执行SELECT语句时,ORACLE依照当前的系统改变号(SYSTEM CHANGE NUMBER-SCN)来保证任何前于当前SCN的未提交的改变不被该语句处理。可以想象:当一个长时间的查询正在执行时,若其他会话改变了该查询要查询的某个数据块,ORACLE将利用回滚段的数据前影像来构造一个读一致性视图。 事务级的读一致性 ORACLE一般提供SQL语句级(SQL STATEMENT LEVEL)的读一致性,可以用以下语句来实现事务级的读一致性。 SET TRANSACTION READ ONLY; 或: SET TANNSACTION SERIALIZABLE; 以上两个语句都将在事务开始后提供读一致性。需要注意的是,使用第二个语句对数据库的并发性和性能将带来影响。 回滚段的种类 系统回滚段:当数据库创建后,将自动创建一个系统回滚段,该回滚段只用于存放系统表空间中对象的前影像。 非系统回滚段:拥有多个表空间的数据库至少应该有一个非系统回滚段,用于存放非系统表空间中对象的数据前影像。非系统回滚段又分为私有回滚段和公有回滚段,私有回滚段应在参数文件的ROLLBACK SEGMENTS参数中列出,以便例程启动时自动使其在线(ONLINE)。公有回滚段一般在OPS(ORACLE并行服务器)中出现,将在例程启动时自动在线。 DEFERED回滚段:该回滚段在表空间离线(OFFLINE)时由系统自动创建,当表空间再次在线(ONLINE)时由系统自动删除,用于存放表空间离线时产生的回滚信息。
自9i之后,回滚段默认设置由数据库自行管理,这大大降低了DBA的维护成本,一般不需要进行回滚段的创建,修改和删除工作了,只要undotbs1表空间能够有足够的空间就行。
select segment_name,owner,tablespace_name,status from dba_rollback_segs t
1 SYSTEM SYS SYSTEM ONLINE
2 _SYSSMU1$ PUBLIC UNDOTBS1 ONLINE
3 _SYSSMU2$ PUBLIC UNDOTBS1 ONLINE
4 _SYSSMU3$ PUBLIC UNDOTBS1 ONLINE
5 _SYSSMU4$ PUBLIC UNDOTBS1 ONLINE
6 _SYSSMU5$ PUBLIC UNDOTBS1 ONLINE
7 _SYSSMU6$ PUBLIC UNDOTBS1 ONLINE
8 _SYSSMU7$ PUBLIC UNDOTBS1 ONLINE
9 _SYSSMU8$ PUBLIC UNDOTBS1 ONLINE
10 _SYSSMU9$ PUBLIC UNDOTBS1 ONLINE
11 _SYSSMU10$ PUBLIC UNDOTBS1 ONLINE
12 _SYSSMU11$ PUBLIC UNDOTBS1 OFFLINE
13 _SYSSMU12$ PUBLIC UNDOTBS1 OFFLINE
14 _SYSSMU13$ PUBLIC UNDOTBS1 OFFLINE
15 _SYSSMU14$ PUBLIC UNDOTBS1 OFFLINE
查询结果说明,系统先创建了一个系统回滚段(system专用),然后又创建了几个公用(public)回滚段。
回滚段的使用 分配回滚段:当事务开始时,ORACLE将为该事务分配回滚段,并将拥有最少事务的回滚段分配给该事务。事务可以用以下语句申请指定的回滚段: SET TRANSTRACTION USE ROLLBACK SEGMENT rollback_segment
事务将以顺序,循环的方式使用回滚段的区(EXTENTS),当当前区用满后移到下一个区。几个事务可以写在回滚段的同一个区,但每个回滚段的块只能包含一个事务的信息。 例如(两个事务使用同一个回滚段,该回滚段有四个区): 1、事务在进行中,它们正在使用回滚段的第三个区; 2、当两个事务产生更多的回滚信息,它们将继续使用第三个区; 3、当第三个区满后,事务将写到第四个区,当事务开始写到一个新的区时,称为翻转(WRAP); 4、当第四个区用满时,如果第一个区是空闲或非活动(使用该区的所有事务完成而没有活动的事务)的,事务将接着使用第一个区。 回滚段的扩张(EXTEND) 当当前回滚段区的所有块用完而事务还需要更多的回滚空间时,回滚段的指针将移到下一个区。当最后一个区用完,指针将移到第一个区的前面。回滚段指针移到下一个区的前提是下一个区没有活动的事务,同时指针不能跨区。当下一个区正在使用时,事务将为回滚段分配一个新的区,这种分配称为回滚段的扩展。回滚段将一直扩展到该回滚段区的个数到达回滚段的参数MAXEXTENTS的值时为止。 回滚段的回收和OPTIMAL参数 OPTIMAL参数指明回滚段空闲时收缩到的位置,指明回滚段的OPTIMAL参数可以减少回滚段空间的浪费。
创建回滚段 语法: CREATE [PUBLIC] ROLLBACK SEGMENT rollback_segment [TABLESPACE tablespace] [STORAGE ([INITIAL integer[K|M]] [NEXT integer[K|M]] [MINEXTENTS integer] [MAXTENTS {integer|UNLIMITED}] [OPTIMAL {integer[K|M]|NULL}]) ] 注: 回滚段可以在创建时指明PRIVATE或PUBLIC,一旦创建将不能修改。 MINEXTENTS 必须大于等于2 PCTINCREASE必须是0 OPTIMAL如果要指定,必须大于等于回滚段的初始大小(由MINEXTENTS指定) 建议: 一般情况下,INITIAL=NEXT 设置OPTIMAL参数来节约空间的使用 不要设置MAXEXTENTS为UNLIMITED 回滚段应创建在一个特定的回滚段表空间内 例: CREATE ROLLBACK SEGMENT rbs01 TABLESPACE rbs STORAGE ( INITIAL 100K NEXT 100K MINEXTENTS 10 MAXEXTENTS 500 OPTIMAL 1000K); 使回滚段在线 当回滚段创建后,回滚段是离线的,不能被数据库使用,为了使回滚段被事务利用,必须将回滚段在线。可以用以下命令使回滚段在线: ALTER ROLLBACK SEGMENT rollback_segment ONLINE; 例: ALTER ROLLBACK SEGMENT rbs01 ONLINE; 为了使回滚段在数据库启动时自动在线,可以在数据库的参数文件中列出回滚段的名字。例如在参数文件中加入以下一行: ROLLBACK_SEGMENT=(rbs01,rbs02) 修改回滚段的存储参数 可以使用ALTER ROLLBACK SEGMENT命令修改回滚段的存储参数(包括OPTIMAL,MAXEXTENTS)。 语法: ALTER ROLLBACK SEGMENT rollback_segment [STORAGE ([NEXT integer[K|M]] [MINEXTENTS integer] [MAXEXTENTS {integer|UNLIMITED}] [OPTIMAL {integer[K|M]|NULL}]) ] 例: ALTER ROLLBACK SEGMENT rbs01 STORAGE (MAXEXTENTS 1000); 回收回滚段的空间 如果指定了回滚段的OPTIMAL参数,ORACLE将自动回收回滚段到OPTIMAL指定的位置。用户也可以手动回收回滚段的空间。 语法: ALTER ROLLBACK SEGMENT rollback_segment SHRINK [TO integer [K|M]]; 说明: 如果不指明TO integer的数值,ORACLE将试图回收到OPTIMAL的位置。 例: ALTER ROLLBACK SEGMENT rbs01 SHRINK TO 2M; 使回滚段离线 为了达到以下两个目的将要回滚段离线: 1.阻止新的事务使用该回滚段; 2.该回滚段必须删除。 语法: ALTER ROLLBACK SEGMENT rollback_segment OFFLINE; 例: ALTER ROLLBACK SEGMENT rbs01 OFFLINE; 说明: 如果有事务正在使用该回滚段,运行该命令后,回滚段的状态将是PENDING OFFLINE。事务结束后,状态将改为OFFLINE,可以通过V$ROLLSTAT查询回滚段的状态。 删除回滚段 当回滚段不再需要或要重建以改变INITIAL,NEXT或MINEXTENTS参数时,可以将其删除。要删除回滚段,不许使该回滚段离线。 语法: DROP ROLLBACK SEGMENT rollback_segment; 例: DROP ROLLBACK SEGMENT rbs01; 查询回滚段的信息 所用数据字典:DBA_ROLLBACK_SEGS
Column
Datatype
NULL
Description
SEGMENT_NAME
VARCHAR2(30)
NOT NULL
Name of the rollback segment
OWNER
VARCHAR2(6)
Owner of the rollback segment
TABLESPACE_NAME
VARCHAR2(30)
NOT NULL
Name of the tablespace containing the rollback segment
SEGMENT_ID
NUMBER
NOT NULL
ID number of the rollback segment
FILE_ID
NUMBER
NOT NULL
File identifier number of the file containing the segment head
BLOCK_ID
NUMBER
NOT NULL
ID number of the block containing the segment header
INITIAL_EXTENT
NUMBER
Initial extent size in bytes
NEXT_EXTENT
NUMBER
Secondary extent size in bytes
MIN_EXTENTS
NUMBER
NOT NULL
Minimum number of extents
MAX_EXTENTS
NUMBER
NOT NULL
Maximum number of extent
PCT_INCREASE
NUMBER
NOT NULL
Percent increase for extent size
STATUS
VARCHAR2(16)
Rollback segment status
INSTANCE_NUM
VARCHAR2(40)
Rollback segment owning Oracle Real Application Cluster instance number
RELATIVE_FNO
NUMBER
NOT NULL
Relative file number of the segment header
可以查询的信息:回滚段的标识(SEGMENT_ID)、名称(SEGMENT_NAME)、所在表空间(TABLESPACE_NAME)、类型(OWNER)、状态(STATUS)。 例: SQL>SELECT segment_name,tablespace_name,owner,status FROM dba_rollback_segs; 回滚段的统计信息 数据字典:V$ROLLNAME,V$ROLLSTAT
Column
Datatype
Description
USN
NUMBER
Rollback segment number
LATCH
NUMBER
Latch for the rollback segment
EXTENTS
NUMBER
Number of extents in the rollback segment
RSSIZE
NUMBER
Size (in bytes) of the rollback segment. This value differs by the number of bytes in one database block from the value of the BYTES column of the ALL/DBA/USER_SEGMENTS views.
See Also: Oracle9i Database Administrator's Guide.
WRITES
NUMBER
Number of bytes written to the rollback segment
XACTS
NUMBER
Number of active transactions
GETS
NUMBER
Number of header gets
WAITS
NUMBER
Number of header waits
OPTSIZE
NUMBER
Optimal size of the rollback segment
HWMSIZE
NUMBER
High water mark of rollback segment size
SHRINKS
NUMBER
Number of times the size of a rollback segment decreases
WRAPS
NUMBER
Number of times rollback segment is wrapped
EXTENDS
NUMBER
Number of times rollback segment size is extended
AVESHRINK
NUMBER
Average shrink size
AVEACTIVE
NUMBER
Current size of active extents, averaged over time.
STATUS
VARCHAR2(15)
Rollback segment status:
ONLINE PENDING OFFLINE OFFLINE FULLCUREXT
NUMBER
Current extent
CURBLK
NUMBER
Current block
例: SQL>SELECT n.name,s.extents,s.rssize,s.optsize,s.hwmsize,s.xacts,s.status FROM v$rollname n,v$rollstat s WHERE n.usn=s.usn; 数据字典:v$undostat
V$undostat动态字典给出一个系统工作的统计柱状图。统计内容包括花费空间,事务数量和实例的执行时间长度等信息。DBA可以使用这个视图中的统计信息估计需要的回滚段空间数量。如果回滚段是处于手工管理状态,则这个视图中没有数据。
系统将会间隔10分钟搜集一次统计信息并保存到动态视图v$undostat中,结果按照begin_time字段降序排列。视图最多保存1008条数据记录,保留7天的循环数据。
Column
Datatype
Description
BEGIN_TIME
DATE
Identifies the beginning of the time interval
END_TIME
DATE
Identifies the end of the time interval
UNDOTSN
NUMBER
Represents the last active undo tablespace in the duration of time. The tablespace ID of the active undo tablespace is returned in this column. If more than one undo tablespace was active in that period, the active undo tablespace that was active at the end of the period is reported.
UNDOBLKS
NUMBER
Represents the total number of undo blocks consumed. You can use this column to obtain the consumption rate of undo blocks, and thereby estimate the size of the undo tablespace needed to handle the workload on your system.
TXNCOUNT
NUMBER
Identifies the total number of transactions executed within the period
MAXQUERYLEN
NUMBER
Identifies the length of the longest query (in number of seconds) executed in the instance during the period. You can use this statistic to estimate the proper setting of the UNDO_RETENTION initialization parameter.
MAXCONCURRENCY
NUMBER
Identifies the highest number of transactions executed concurrently within the period
UNXPSTEALCNT
NUMBER
Number of attempts to obtain undo space by stealing unexpired extents from other transactions
UNXPBLKRELCNT
NUMBER
Number of unexpired blocks removed from certain undo segments so they can be used by other transactions
UNXPBLKREUCNT
NUMBER
Number of unexpired undo blocks reused by transactions
EXPSTEALCNT
NUMBER
Number of attempts to steal expired undo blocks from other undo segments
EXPBLKRELCNT
NUMBER
Number of expired undo blocks stolen from other undo segments
EXPBLKREUCNT
NUMBER
Number of expired undo blocks reused within the same undo segments
SSOLDERRCNT
NUMBER
Identifies the number of times the error ORA-01555 occurred. You can use this statistic to decide whether or not the UNDO_RETENTION initialization parameter is set properly given the size of the undo tablespace. Increasing the value of UNDO_RETENTION can reduce the occurrence of this error.
NOSPACEERRCNT
NUMBER
Identifies the number of times space was requested in the undo tablespace and there was no free space available. That is, all of the space in the undo tablespace was in use by active transactions. The corrective action is to add more space to the undo tablespace.
回滚段的当前活动事务 数据字典:V$SESSION,V$TRANSACTION 例: SQL>SELECT s.username,t.xidusn,t.ubafil,t.ubablk,t.used_ublk FROM v$session s,v$transaction t WHERE s.saddr=t.ses_addr; USERNAME XIDUSN UBAFIL UBABLK USED_UBLK ------- -------- ----------- ----------- ----------- SYSTEM 2 2 7 1 SCOTT 1 2 163 1 2 rows selected.
回滚段的数量规划 对于OLTP系统,存在大量的小事务处理,一般建议: 数量多的小回滚段;每四个事务一个回滚段;每个回滚段不要超过十个事务。 对于批处理,一般建议: 少的大回滚段;每个事务一个回滚段。 回滚段的问题及解决方法 问题一:事务要求的回滚段空间不够,表现为表空间用满(ORA-01560错误),回滚段扩展到达参数MAXEXTENTS的值(ORA-01628)。 解决方法:向回滚段表空间添加文件或使已有的文件变大;增加MAXEXTENTS的值。 问题二:读一致性错误(ORA-01555 SNAPSHOT TOO OLD) 解决方法:增加MINEXTENTS的值,增加区的大小,设置一个高的OPTIMAL值。
如果检测到丢失或者损坏回滚段表空间的数据文件,并且数据库时运行着的,不要把它down掉,在很多情况下,数据库open时比shutdown时更容易解决问题。
这种情况下有两种可能的解决方法:
A) 使丢失的那个文件offline,并从备份中恢复它,这种情况适用于数据库是处于归档方式的。
B) 另外一个方法是offline掉所有的那个文件所属表空间的回滚段,drop那个表空间,然后create它们。这时需要杀掉那些使用着回滚段的进程,以便使他offline。
从备份中恢复那个数据文件
1, 脱机(offline 那个丢失的数据文件)
Alter database datafile 8 offline;
提示:基于目前数据库的事务量,你可能需要建一个临时的回滚段空间和一些临时的回滚段以备正常业务运行。
2、从备份中恢复(restore)那个数据文件
3、执行如下命令
Select v1.group#,member,sequence# from v$log v1, v$logfile v2
Where v1.group# = v2.group#;
这将列出所有的联机重做日志和他们的序号及首次改变号(first change numbers)。
4、使用联机日志及归档日志恢复那个文件
Recover datafile
5、确认所有的日志都被恢复,直到你收到“media recovery complete”信息。
6、使这个数据文件online
Alter database datafile online;
重建回滚段空间,这种方法不必考虑数据库是否是归档模式的
步骤如下:
1 、试图脱机所有的丢失或损坏数据文件所在回滚表空间中所包含的回滚段。
ALTER ROLLBACK SEGMENT OFFLINE;
重复执行这个命令直到所包含的回滚段都脱机 .
2 、检查回滚段的状态。
在 drop 掉它们之前它们必需是 offline 状态的。
SELECT SEGMENT_NAME, STATUS FROM DBA_ROLLBACK_SEGS WHERE TABLESPACE_NAME = <TABLESPACE_NAME>;
3 、删除掉所有脱机的 c 。
DROP ROLLBACK SEGMENT ;
4 、处理那些保持 online 状态的回滚段
重复执行 2 一下的命令,如果回滚段在执行 1 中命令仍保扭亏为盈 "ONLINE" 状态,意味着它之中有活动的事务,你可以用如下的查询来确认一下:
SELECT SEGMENT_NAME, XACTS ACTIVE_TX, V.STATUS FROM V$ROLLSTAT V, DBA_ROLLBACK_SEGS WHERE TABLESPACE_NAME = <TABLESPACE_NAME> AND SEGMENT_ID = USN;
如果这个查询没有结果返回,意味着没有事务在这些回滚段中了。哪果有结果返回,那些不能offline 的回滚段的状态应为 "PENDING OFFLINE" 。可以用 5 中的方法把这些事务杀掉。
5 、强制使有活动事务的回滚段脱机
执行如下查询,看这些 "PENDING OFFLINE" 的回滚段包含哪些事务。
SELECT S.SID, S.SERIAL#, S.USERNAME, R.NAME "ROLLBACK" FROM V$SESSION S, V$TRANSACTION T, V$ROLLNAME R WHERE R.NAME IN (<PENDING_ROLLBACK_1>, ... , <PENDING_ROLLBACK_N>) AND S.TADDR = T.ADDR AND T.XIDUSN = R.USN;
用 ALTER SYSTEM KILL SESSION , ; 语句杀掉这些事务,重复执行上面的查询,直到没有事务存在,这时运行一下 2 中的查询,确认这些回滚段己经处于 offline 状态 , 并用 3 中的语句把它们 drop 掉。
6 、删除这个回滚表空间。
DROP TABLESPACE INCLUDING CONTENTS;
如果语句执行失败,请与 oracle 技术支持联系,否则转向 7
7 、重建回滚段表空间。
8 、重建回滚段,并使它们联机 (online) 。
译者按:回滚段表空间的数据文件丢失或损坏在实际中是比较棘手和常见的,产生这种问题 的原回很多的,比如介质的损坏、人为的误操作、机器的突然的断电等等。
建议没实践过这种操作的 oracle 的爱好者可以模拟一下这种故障,实际实测一下,注意一定要在测试库,我模拟的方法如下:
1 、单独建了一个 rbs 表空间,并在这个表空间建了一个回滚段 rbs_test 。
2 、指定一个 transaction 用这个回滚段
sql>set transaction use rollback segment rbs_test; sql>insert into test values (2); sql>insert into test values(3);
3 、另开一个 telnet 窗口 telnet 至主机,执行如下命令 :
sqlplus /nolog sql>conn / as sysdba sql>shutdown abort
4 、把新加的那个回滚段表空间的数据文件更个名。
我用system用户在sql下输入alter rollback segment rbs01 shrink to 100M;
1.查看表空间 select tablespace_name,sum(bytes)/1024/1024/1024 GB from dba_data_files group by tablespace_name union all select tablespace_name,sum(bytes)/1024/1024/1024 GB from dba_temp_files group by tablespace_name order by GB; 2.确认文件 select file_name,bytes/1024/1024 from dba_data_files where tablespace_name like 'UNDOTBS1'; 3.检查UNDO Segment状态 select usn,xacts,rssize/1024/1024/1024,hwmsize/1024/1024/1024,shrinks from v$rollstat order by rssize; 4.创建新的UNDO表空间 create undo tablespace undotbs2 DATAFILE '/home/oracle/oradata/oracle/undotbs02.dbf' size 1024m AUTOEXTEND ON MAXSIZE 2048M; 5.切换UNDO表空间为新的UNDO表空间 alter system set undo_tablespace=undotbs2 scope=both; 6.等待原UNDO表空间所有UNDO SEGMENT OFFLINE select usn,xacts,status,rssize/1024/1024/1024,hwmsize/1024/1024/1024,shrinks from v$rollstat order by rssize; 7.删除原UNDO表空间 drop tablespace undotbs1 including contents;