ORA-01102 cannot mount database in EXCLUSIVE mode解决方法

    技术2022-05-19  43

    ORA-01102 cannot mount database in EXCLUSIVE mode解决方法

    某系统突然掉电,系统启动后发现Oracle无法启动。

    启动时报如下错误:

    ORA-01102 cannot mount database in EXCLUSIVE mode 

    出现1102错误可能有以下几种可能:

    一、在HA系统中,已经有其他节点启动了实例,将双机共享的资源(如磁盘阵列上的裸设备)占用了;

     

    二、说明Oracle被异常关闭时,有资源没有被释放,一般有以下几种可能,

    1、 Oracle的共享内存段或信号量没有被释放;

    2、 Oracle的后台进程(如SMONPMONDBWn等)没有被关闭;

    3、 用于锁内存的文件lk<sid>sgadef<sid>.dbf文件没有被删除。

     

    首先,虽然我们的系统是HA系统,但是备节点的实例始终处在关闭状态,这点通过在备节点上查数据库状态可以证实。

    其次、是因系统掉电引起数据库宕机的,系统在接电后被重启,因此我们排除了第二种可能种的12点。最可疑的就是第3点了。

    $ORACLE_HOME/dbs目录:

    $ cd $ORACLE_HOME/dbs$ ls sgadef*sgadef* not found$ ls lk*lkORA92

    果然,lk<sid>文件没有被删除。将它删除掉

    $ rm lk* 

    再启动数据库,成功。

    如果怀疑是共享内存没有被释放,可以用以下命令查看:

    $ipcs -mopIPC status from /dev/kmem as of Thu Jul  6 14:41:43 2006T      ID     KEY        MODE        OWNER     GROUP NATTCH  CPID  LPIDShared Memory:m       0 0x411c29d6 --rw-rw-rw-      root      root      0   899   899m       1 0x4e0c0002 --rw-rw-rw-      root      root      2   899   901m       2 0x4120007a --rw-rw-rw-      root      root      2   899   901m  458755 0x0c6629c9 --rw-r-----      root       sys      2  9113 17065m       4 0x06347849 --rw-rw-rw-      root      root      1  1661  9150m   65541 0xffffffff --rw-r--r--      root      root      0  1659  1659m  524294 0x5e100011 --rw-------      root      root      1  1811  1811m  851975 0x5fe48aa4 --rw-r-----    oracle  oinstall     66  2017 25076 

    然后它ID号清除共享内存段:

    $ipcrm –m 851975 

    对于信号量,可以用以下命令查看:

    $ipcs -sopIPC status from /dev/kmem as of Thu Jul  6 14:44:16 2006T      ID     KEY        MODE        OWNER     GROUPSemaphores:s       0 0x4f1c0139 --ra-------      root      root... ...s      14 0x6c200ad8 --ra-ra-ra-      root      roots      15 0x6d200ad8 --ra-ra-ra-      root      roots      16 0x6f200ad8 --ra-ra-ra-      root      roots      17 0xffffffff --ra-r--r--      root      roots      18 0x410c05c7 --ra-ra-ra-      root      roots      19 0x00446f6e --ra-r--r--      root      roots      20 0x00446f6d --ra-r--r--      root      roots      21 0x00000001 --ra-ra-ra-      root      roots   45078 0x67e72b58 --ra-r-----    oracle  oinstall 

    根据信号量ID,用以下命令清除信号量:

    $ipcrm -s 45078 

    如果是Oracle进程没有关闭,用以下命令查出存在的oracle进程:

    $ps -ef|grep ora  oracle 29976     1  0  Jun 22  ?         0:52 ora_dbw0_ora92  oracle 29978     1  0  Jun 22  ?         0:51 ora_dbw1_ora92  oracle  5128     1  0  Jul  5  ?         0:00 oracleora92 (LOCAL=NO)... ... 

    然后用kill -9命令杀掉进程

    $kill -9 <PID> 

    总结:

    当发生1102错误时,可以按照以下流程检查、排错:

    1.如果是HA系统,检查其他节点是否已经启动实例;2.检查Oracle进程是否存在,如果存在则杀掉进程;3.检查信号量是否存在,如果存在,则清除信号量;4.检查共享内存段是否存在,如果存在,则清除共享内存段;5.检查锁内存文件lk<sid>sgadef<sid>.dbf是否存在,如果存在,则删除。


    最新回复(0)