いやーん

仕事おわんなーい♪…っていつも言ってるような…orz

先日、NTT東日本の「ひかり電話」が東京から北海道まで一部ダウンする広域事故があったのですが、人為&プログラムミスだそうで…。

中継サーバのHDDを交換したのは5月21日深夜から5月22日未明。故障ではなく予防的措置として交換した。その際、作業者が間違ったコマンドパラメータを設定したが、サーバのフェイルセーフ機能が不十分で、誤ったパラメータを受け付けてしまった。さらに、誤ったパラメータでHDDのデータが破壊されるバグがソフトウェアにあり、HDDのデータが一部破壊されてしまった。

RAID-5か6のディスクが1本イカレタので、新規HDつっこんでリビルドしようとしたら…ってパターンっぽいっすねぇ。
「プログラム」…って書かれているけど、シェルスクリプトかPerlスクリプトかなんかが、引数をそのまま処理するようにしてたんジャマイカ?

まぁ、これから暑くなるので、HDDトラブルが多発する時期ですなぁ…。
うちも古いマシンを入れ替えして増強する予定だが…忙しくて段取り取れない罠。
無事なうちにはよせな…。

あ、その前に、1/4みくるバニーを撮影しないととと(ぇー

ニュースソース:HDD交換ミス&バグで4時間ダウンしてしまう「ひかり電話」 - @IT

カテゴリー: UN*X パーマリンク