RAC之节点Linux kernel监测

    技术2025-12-27  5

    1ORACLE最早使用的监测模块:watchdog

    http://blog.csdn.net/wyzxg/archive/2010/05/11/5579415.aspx

     

    其中的http://www.ibm.com/developerworks/cn/linux/l-cn-watchdog/index.html文章看起来,每个知识点都是那么的熟悉,看完后有种感伤袭来,我的专业........

     

    2:从oracle9.2oracle 11.1,linux下建立RAC时推荐使用一个I/O fencing模块:hangcheck-timer

     

    推荐看英文,写得比较清晰,可以按照以下链接的顺序了解,对这个模块的很容易理解的:

    1)【转】http://www.ochef.net/tag/rachangcheck-timer

    Configure the hangcheck-timer Kernel Module for Oracle Cluster

    首先得感谢小荷的这篇文章让我重新学习了hangcheck-timer这个内核模块。在这之前,也就是我刚开始接触Oracle的时候自己在虚拟机中做实验,根据网上的一篇文档学习安装Oracle Cluster。记得文档中说:该模块在AS2.1-E16以上的核心或者是3.0的核心中系统开始自带hangcheck-timer来代替watchdog守护进程,不需要安装。那时并没有认真去了解这个hangcheck-timer模块,这个内核模块对Oracle RAC系统是很非常重要的。

    Oracle9202以前,都是使用watchdog来检查系统是否挂起,9202以后,oracle使用hangcheck-timer模块。 hangcheck-timer模块使用基于内核时钟周期性去定时检查系统是否被挂起,如果检测到系统已经被挂起,将重置节点上的时钟。该模块用二个参数表示多少时间以后系统没响应就认为是挂起。

     

    hangcheck_tick:该参数定义了模块启动的间隔时段,其默认值为 60 秒。 Oracle建议将其设置为 30 秒。

    hangcheck_margin:该参数定义了多少时间以后系统没响应就认为是挂起。以秒为单位,默认值为 180秒。Oracle 建议将其设置为 180 秒。

     

    使用下面的命令检查该模块是否存在:

    # find  /lib/modules -name “hangcheck-timer.ko”

    /lib/modules/2.6.9-78.ELsmp/kernel/drivers/char/hangcheck-timer.ko

    /lib/modules/2.6.9-78.EL/kernel/drivers/char/hangcheck-timer.ko

     

    手动加载该模块到内核:

    # modprobe hangcheck-timer

     

    检查该模块加载是否成功:

    # grep Hangcheck /var/log/messages | tail -1

    Aug  8 07:36:33 ora9i kernel: Hangcheck: starting hangcheck timer 0.9.0 (tick is 180 seconds, margin is 60 seconds).

     

    手动加载模块,重启后失效,可以将其加载模块的命令添加到/etc/modules.conf

    # echo “options hangcheck-timer hangcheck_tick=30 hangcheck_margin=180″ >> /etc/modules.conf

    或者在/etc/rc.local文件中增加下列命令

    /sbin/insmod hangcheck-timer hangcheck_tick=30 hangcheck_margin=180

    关于hangcheck-timer内核模块的相关资料,也可以点击这里获得

     

    2)【英文(盖哥的文章链接)】

    http://www.eygle.com/digest/2007/12/configure-the-hangcheck-timer.html

     

     

    3:linux平台上的Oracle Clusterware 10.2.0.4和以后版本引入了一个新的Oracle Clusterware Process Monitor Daemon (OPROCD) 进程来监控系统状态和集群中的每个节点的健康状态:

    不知道怎么用,查了点文章,也没有什么详细介绍。暂且搁置吧,我还得深入学习.NET呢,工作需要。

    http://blog.csdn.net/Johnvikey/archive/2010/12/28/6102170.aspx

    PS:今天上ORACLE官方网的时候,不小心开了一篇文章,甚是伤感,用过一阵VBOX+SOLARIS,现在都改名称了,有兴趣的可以试试,感觉就是不如VM好,http://wikis.sun.com/display/solaris/Installing+Oracle+Solaris+10+in+Oracle+VM+VirtualBox

    最新回复(0)