4,5,7月と3回にわたってDELL PowerEdge 1950?が停止・リブートした。
DELLの管理ツールであるServerManagerのエラーメッセージは
Sun Jul 26 13:10:48 2009 CPU Bus PERR: Processor sensor, transition to non-recoverable was asserted
Sun Jul 26 13:18:43 2009 System Board OS Watchdog: Watchdog sensor for System Board, reboot was asserted
過去2回は、原因が釈然としないまま、マザーボードやRAIDカード、メモリなどのほぼすべての部品を交換した。
・・で今回、再度、2ヶ月ぶりに障害発生。
「今度は、本体ごと交換くらいしか考えられないな」などと思いつつ、DELLサポートに電話。
DELLの優秀な技術サポート担当K氏が、原因を見つけてくれましたよ。
この問題は、更新プログラム 948515 をインストールした後に Vhdstor.sys ドライバが Version 1.1.623.0 に正常にアップグレードされなかったことが原因で発生します。
この更新プログラム (KB956124) をインストールすると、このような問題は発生しません。
…って馬鹿野郎。948515のせいで、956124が必要になったんだってさ。
(・・っていうか、2008/09のパッチがなんで今更当たったんだろう?謎が謎を呼ぶ)
これでしばらく様子見。