Sympom:
在11.2.0.3 or 11.2.0.4 RAC如遇到multipath mpio切換或斷線時,因為Redhat Linux 6 的Disk timeout 為60秒(default)
但ASM heart beat timeout 是15秒, 所以在災難發生時,FC path回復之前,ASM就偵測到dead path,
即會把Diskgroup dismount or offline voting disks…導致node reboot災難...
解決方法:
是加大_asm_hbeatiowait , 從預設的15秒 加大到120秒 (12.1.0.2 以後Oracle已經放大此參數到120秒)
設定方法:
SQL> alter system set "_asm_hbeatiowait"=120 scope=spfile sid='*';.
設定後須重啟GRID / ASM Instance
--
另外for 10.2.0.4 RAC的timeout Tuning部分請參考這一篇:
RAC nodes 在比較忙的時候,會因為cssd health check timeout 造成reboot現象,需放大這個health check 機制。
沒有留言:
張貼留言