珍しいトラブル事例紹介
コンピューター機器に今起きているトラブルの症状から推測すると、原因はここのはず。その「はず」が違っていると、泥沼にはまり、問題解決までに時間がかかることがあります。
今回は、その「はず」が違っていて、別に真の原因があったという珍しいトラブル事例を2つ紹介します。
- 事例1 サーバーが不特定のタイミングで勝手に再起動してしまう症状
- 事例2 サーバーの監視ツールでは、電源ユニットが故障と表示されているのに、電源ユニットは故障していなかった症状
事例1 サーバーが不特定のタイミングで勝手に再起動してしまう症状
症状(詳細)
- 某メーカーの特定機種のサーバーで、Windows使用中に不特定のタイミングで勝手にサーバーが再起動してしまう症状です。
- Windowsを起動させずに、CD起動したメモリ診断を実行中にでも、この症状は発生します。
- Windowsを起動させずに、System BIOSの設定画面にしておいても、この症状は発生します。
- 同じUPS(無停電電源装置)を使用している隣で動作している他のサーバーでは、この症状は発生していません。
一般的に考えられる故障部品
- HDDからWindowsを起動させなくても、この症状が発生するところからみて、HDDが故障している可能性は極めて低くなります。
- 同じUPSを使用している他のサーバーではこの症状が出ないことから、UPSとそのACコンセント側は正常に動作しているものと考えられます。
- 症状は不特定のタイミングで発生し、症状から考えられる故障部品は、以下の部品になります。
① マザーボードの故障で、間欠的に起きる症状。(可能性:大)
② 電源ユニットからのDC出力電圧が瞬断するために起きる症状。(可能性:中)
③ ECC付きメモリモジュールの間欠的な障害。(可能性:小)
真の原因
- 今回の症状では、マザーボード、電源ユニット、メモリモジュールの障害が原因ではありませんでした。真の原因は、フロントパネルにあるリセットスイッチが、触っていないにも関わらず、間欠的に押されたのと同じ状態になり、不特定のタイミングで勝手に再起動がかかってしまうというものでした。修理には、このリセットスイッチが実装されている部品を交換する必要があります。
- サーバーの監視ツールで、履歴を見ると、リセットスイッチが押されましたという記録が残っていました。
- 一般的な症状を見ただけで、一般的なトラブル切り分けをしてしまいますと、泥沼にはまってしまいます。技術員は、サーバーの監視ツールを見たり、その他のツールを見たり、いろいろなツールを駆使して真の原因を見つけられるようにしなければなりません。
事例2 サーバーの監視ツールでは、電源ユニットが故障と表示されているのに、電源ユニットは故障していなかった症状
症状(詳細)
- このサーバーには、電源ユニットが2台実装され、電源の冗長構成になっていました。
- サーバーの管理ツールで見ると、片方の電源ユニットが故障しているという警告が出ていました。
- 警告の出ている電源ユニットを交換しても、警告は消えません。
- 他方の電源ユニットを交換しても警告は消えません
一般的に考えられる故障部品
- サーバーの監視ツールや、その履歴を見ても、確実に片方の電源ユニットだけが故障しているように思いがちです。
真の原因
- 今回の真の原因は、2つの電源ユニットを切り替えているパワーディストリビュータ―が故障していました。
- サーバーで使われている部品やその仕組みを理解していないと、修理完了までに時間がかかってしまいます。
次のようなサービスをご提供できます。
-
出張修理: 機器やデータを外に持ち出せない方。今は動いているけどシステムの停止時間を最小限にしたい方
-
預かり修理: 間欠なトラブル。複雑な障害。当社で用意してある検証機を使い精度の高いトラブル切り分けができます。修理費を抑えたい方
-
部品販売: 社内で保全担当者の方がご自分で部品交換ができる場合
-
オーバーホールサービス: 今は症状がなくても、オーバーホールすることでこれらの症状を未然に防げる可能性があります。
EOSL製品の延命なら
へお任せくださいお電話・FAXでのお問い合わせ
- 03-5259-6065
- 03-5259-6066