サーバダウンからの復帰

ちょうど一週間ほど前、サーバの調子がおかしいことに気づいた。具体的には、

  1. このサイトでcssを読んでくれなくなったり、blogがエラーをリポートするようになった。

  2. メールを受信してくれない。

1.の方は、たぶんデータ(zopeのData.fsってやつ)が壊れたんだと思う。2.の方は、ログを見たところpostfixは動作している。てことで、たぶんスパムメールフィルタとして使っているscmailのスパム判定データベースが大きくなりすぎて動作不良を起こしていたものと予想。

で、古いメールを整理してscmailのデータベースを造ろうとしたところ、なぜか他のメールまで消えてしまった(実は消えておらず、大量のメールを処理したのでsylpheedが固まっていただけだったことが後に判明)ので、とりあえず一週間ほど前のバックアップからrestoreしてみることに。

ところが、/usrのレベル0リストアに失敗。サーバが勝手にリブートしてしまう。何で?何で? ディスクの寿命? 取り合えずハードディスクを買い換えてみる。って今日びPATAのHDDって売ってないのかよ。しょうがないのでSATAのハードディスクとSATA-PATA変換器をかった。で、このディスクでrestoreしてみたんだが、やっぱり/usrのリストア中にリブートしてしまう。さてどうしたものか。

たぶん、DMAで動作させているのがまずいのかな・・ ということで、PIO4モードでリストアしてみる。今度はうまくリストアしたようだ。

で、このサイトのデータだが、一週間前のデータでも動作がおかしい、というか、スパムトラックバックを消しているうちに勝手にzopeが落ちる。zopeを再インストールしても同様。ぐぐっていろいろ調べてみたところ、zopeのlib/python/ZODB/fsrecover.fsを実行してData.fsを修正できることが分かった。あーでも元データから更新されちゃったし、念のためもう一回リストアか・・・

ということで、何とか復活できました。まだ、scmailのデータベース構築中なのでメールは読めないけど。

コメント(0)



Note

本サイトのハイパーリンクの一部は、オリジナルのサイトが閉鎖してしまったため"Internet archive Wayback Machine"へのリンクとなっています。そのようなリンクにはアイコン[archive]を付与しています。

本サイトはCookieを使用しています。本サイトにおけるCookieは以下の三種類のみであり、Cookieの内容に基づいてサイトの表示を変更する以外の用途には用いておりません。