昨日はSGIのサーバが落ちて、その対応のおかげでシスプリを買いに行けませんでした。
今日こそは定時ダッシュで買いに行くぞと心に固く誓いつつ出社。
「あぁ、ぱる☆ミさん。今朝試験中のサーバが落ちたみたいですよ。対応お願いします」
・・・・やな予感がする。まぁ朝一からの対応だから昼過ぎには終わるだろう。とか思ってましたさ、その時は。
まずは現象の把握。うん、pingに反応無し。sshで接続出来ない。こりゃ完全に落ちてるなぁ。
とりあえずはコンセントルータ経由でコンソールへ接続。ありゃ、OBP(okプロンプト)まで落ちちゃってるよ。
ってことはウォッチドッグリセットだなと予想しつつ、ctraceを実行。んー、CPUがパニック起こしてら。ハード障害かな。
んで取るものをsyncで取って、と。あらコアダンプは取れた。んじゃそんなにひどい障害じゃなさそうだ。立ち上がりそうだなぁ。
bootさせてみたら軽くディスクの障害。fsckして直ったから良しとしよう。どうせ/varの下だし。さすがにvxfsを入れておいた方は何の障害も無し。強いね~~
動いてるうちにexplorerとprtdiagっと。これでSUNに送る情報は揃ったぞと。この時点で約1時間経過で10時半。
うちのサーバ郡は全部ゴールドプラスのサポート契約。どんなに遅くても4時間以内の対応なのだ。うむ、当初の読み通り昼過ぎには終わりだな。
まぁ、ctraceとmessagesを見る限りじゃCPUの障害だよなぁ。
サポートセンターに電話して障害受け付け番号を貰う。んで20分ぐらいして折り返しで電話。症状を説明して用意しておいたファイルをメールで送る。
うちのアカウントエンジニア(要するに専属の人)のレベルの人だと、このctraceとmessagesと、あとOBP上で他にも取っておいた数ファイルを見せれば原因まで特定してくれるんだけれども
今日は普通のサポートの人が対応。大丈夫かなぁ・・・。と思ってたらコアファイルも送れだって。ん?そんなに複雑な障害だったのか??
仕方がないからCD-Rに焼いてバイク便で送付。相手先に着いたのは午後1時。・・・・まぁ・・夕方には直るよな・・・・一応CPU障害っぽいんですけどとは伝えてあるし・・・
結局はあたしの予想通りCPU障害だったんだけれども、特定できたのは午後2時。そりゃサポートだから原因特定は必要だけどまずは見切りで部品を持って現地に行けよ・・・
しかも、ただのサーバ管理者のあたしに分かる事がなんで本職がすぐにわからんのだ(^^;
さて、都合のいい時間を教えてくれ?そんなの極力早くに決まっているだろうが~~~
と、連絡を入れたところで他の仕事に。2時間経っても現地到着の連絡が無い。おかしいなぁ・・・午後4時に催促の電話を入れてみたら
「手違いで今から手配を開始します。19時半には着けると思います」さすがのあたしも許せません。いつ電話したと思ってるんじゃ~とっとと行って18時までに作業を開始しろ~
努力しますとは言ったけれども、SUNのサポート体制は相変わらずですな。ゴールドプラスのレベルでこれだもん、ちなみに年間数億円のサポート料なり。結局マネージャーからもクレームを付けることになったけど。
エンジニアは確かに18時5分前に着いたさ。でも、部品が19時半に到着ってどういう事(^^;
CPU交換が終わって起動出来たのは21時でしたとさ。結局今日もシスプリ買いに行けなかった(;_;)
そんなにあたしにシスプリを買いに行かせたくないのか~~~(笑)
【がおがお】 数憶払って菓子折一つじゃやってられませんな(爆笑) (2001/03/1005:19)
【紗】 そうか・・・SUNはやめとっか(謎 (2001/03/1212:14)
【ぱ】 ハード故障多いよ~ >SUN (2001/03/1212:34)
コメント