逝きそう・・・

火曜日(22日)、会社から帰宅しPC(Windows)を立ち上げる。
サーバーにマウントされているディレクトリを開く。

ん???
ファイルが表示されない??

気になって急遽サーバーをチェック。
サーバーからも直接このディレクトリが見えない。
ログをチェック・・・。

Aug 22 20:05:24 dreamer-site kernel: hde: status timeout: status=0x80 { Busy }
Aug 22 20:05:24 dreamer-site kernel: ide: failed opcode was: unknown
Aug 22 20:05:24 dreamer-site kernel: hde: DMA disabled
Aug 22 20:05:24 dreamer-site kernel: hdf: DMA disabled
Aug 22 20:05:24 dreamer-site kernel: PDC202XX: Primary channel reset.
Aug 22 20:05:24 dreamer-site kernel: hde: drive not ready for command
Aug 22 20:05:54 dreamer-site kernel: ide2: reset timed-out, status=0x80
Aug 22 20:05:59 dreamer-site kernel: hde: status timeout: status=0x80 { Busy }

Aug 22 20:05:59 dreamer-site kernel: ide: failed opcode was: unknown
Aug 22 20:05:59 dreamer-site kernel: PDC202XX: Primary channel reset.
Aug 22 20:05:59 dreamer-site kernel: hde: drive not ready for command
Aug 22 20:06:29 dreamer-site kernel: ide2: reset timed-out, status=0x80
Aug 22 20:06:29 dreamer-site kernel: end_request: I/O error, dev hde, sector 59769231
Aug 22 20:06:29 dreamer-site kernel: end_request: I/O error, dev hde, sector 172455
Aug 22 20:06:29 dreamer-site kernel: end_request: I/O error, dev hde, sector 172463
Aug 22 20:06:29 dreamer-site kernel: end_request: I/O error, dev hde, sector 172471
Aug 22 20:06:29 dreamer-site kernel: end_request: I/O error, dev hde, sector 172479
Aug 22 20:06:29 dreamer-site kernel: Buffer I/O error on device hde1, logical block 21552
Aug 22 20:06:29 dreamer-site kernel: lost page write due to I/O error on hde1
Aug 22 20:06:29 dreamer-site kernel: Aborting journal on device hde1.
Aug 22 20:06:29 dreamer-site kernel: EXT3-fs error (device hde1): ext3_get_inode_loc: unable to read inode block – inode=3736864, block=7471146
Aug 22 20:06:29 dreamer-site kernel: end_request: I/O error, dev hde, sector 63
Aug 22 20:06:29 dreamer-site kernel: Buffer I/O error on device hde1, logical block 0
Aug 22 20:06:29 dreamer-site kernel: lost page write due to I/O error on hde1
Aug 22 20:06:29 dreamer-site kernel: ext3_abort called.
Aug 22 20:06:29 dreamer-site kernel: EXT3-fs error (device hde1): ext3_journal_start_sb: Detected aborted journal
Aug 22 20:06:29 dreamer-site kernel: Remounting filesystem read-only
Aug 22 20:06:29 dreamer-site kernel: end_request: I/O error, dev hde, sector 40403023
Aug 22 20:06:29 dreamer-site kernel: EXT3-fs error (device hde1): ext3_find_entry: reading directory #2523139 offset 0
Aug 22 20:06:29 dreamer-site kernel: end_request: I/O error, dev hde, sector 40403023
Aug 22 20:06:29 dreamer-site kernel: EXT3-fs error (device hde1): ext3_readdir: directory #2523139 contains a hole at offset 0
Aug 22 20:06:56 dreamer-site kernel: end_request: I/O error, dev hde, sector 40403023
Aug 22 20:06:56 dreamer-site kernel: EXT3-fs error (device hde1): ext3_readdir: directory #2523139 contains a hole at offset 0
Aug 22 20:06:59 dreamer-site kernel: end_request: I/O error, dev hde, sector 40403023
Aug 22 20:06:59 dreamer-site kernel: EXT3-fs error (device hde1): ext3_readdir: directory #2523139 contains a hole at offset 0
Aug 22 20:07:00 dreamer-site kernel: end_request: I/O error, dev hde, sector 40403023
Aug 22 20:07:00 dreamer-site kernel: EXT3-fs error (device hde1): ext3_readdir: directory #2523139 contains a hole at offset 0
Aug 22 20:07:02 dreamer-site kernel: end_request: I/O error, dev hde, sector 55574615
Aug 22 20:07:02 dreamer-site kernel: Buffer I/O error on device hde1, logical block 6946819
Aug 22 20:07:02 dreamer-site kernel: lost page write due to I/O error on hde1
Aug 22 20:07:02 dreamer-site kernel: end_request: I/O error, dev hde, sector 57147535
Aug 22 20:07:02 dreamer-site kernel: Buffer I/O error on device hde1, logical block 7143434
Aug 22 20:07:02 dreamer-site kernel: lost page write due to I/O error on hde1

ここには /dev/hde1 のエラーを抜粋したが、同様に /dev/hdg1 も吐き出されている・・・。
気になるのは sector 関係のエラーも吐き出されていることだ><;
とりあえず、急遽再起動させ再マウントさせる。
ファイル自体は見えるようになったが、不安がかなり残る・・・。

翌日、再度ログをチェックしたら・・・。

Aug 23 14:40:57 dreamer-site kernel: hdg: dma_intr: status=0x51 { DriveReady SeekComplete Error }
Aug 23 14:40:57 dreamer-site kernel: hdg: dma_intr: error=0x84 { DriveStatusError BadCRC }
Aug 23 14:40:57 dreamer-site kernel: ide: failed opcode was: unknown
Aug 23 14:45:38 dreamer-site kernel: kjournald starting. Commit interval 5 seconds
Aug 23 14:45:38 dreamer-site kernel: EXT3 FS on hde1, internal journal
Aug 23 14:45:38 dreamer-site kernel: EXT3-fs: mounted filesystem with ordered data mode.
Aug 23 14:52:32 dreamer-site kernel: hdg: dma_intr: status=0x51 { DriveReady SeekComplete Error }
Aug 23 14:52:32 dreamer-site kernel: hdg: dma_intr: error=0x84 { DriveStatusError BadCRC }
Aug 23 14:52:32 dreamer-site kernel: ide: failed opcode was: unknown

こんな感じのエラーが連続出現。

ん〜〜、こりゃ本気モードでヤバヤバ。
たしか予備の換えHDDが1台あったはずなので、それを使って、重要度の高い方を優先して交換するしかないかな。
作業の時間がとれないから週末までなんとかもってくれればいいけど・・・。

(17:15:追記)
/dev/hde のドライブをWindowsで言うディスクチェックをかけて復旧を試みたが不良セクタが多すぎてNG・・・orz
フォーマットし直そうかと思ったが、コマンドが拒否られるΣ(゚Д゚;
完全にOUTのようだ・・・。
今までダウンロードしたソフトやドライバー関係がすべて藻屑となって消え去ってしまった><;

投稿者:Hyperdoll 投稿日時:

FedoraCore5 インストール

会社で廃棄されそうなNECのExpress5800/120Edがあったので、ためしにFC5を入れてみた。
さすがPentiumIIIな端末だけあってSCSI RAID組んでいても総容量50GByteぐらいしかない^^;

とりあえず容量を稼ぎたいのですでに組んであったRAID 1(20GByte)を解除して、RAID 0にして50GByte確保。

CDドライブが古いせいもあるがインストールだけで約2時間ほどかかり、パッケージのアップデートで1〜2時間・・・orz
ほぼ半日がかりの作業でした(笑

GUI起動させるとさすがに重い(笑
オンボードのビデオチップのせいもあるが、空冷のファンが唸りっぱなし、HDDはカリカリ唸ってるし^^;
CUIで利用するには、まぁなんとかいけるかな?って感じですね。
さすがに最近のディストリでGUI使うにはある程度のCPU+ビデオカード必須ということですね。

しばらくは、いろいろつっ込んでみて、テストがてら遊んでみようかな^^;

投稿者:Hyperdoll 投稿日時:

PostgreSQL 8.1.1へ

先月、自宅サーバーをリプレースして、ちょこちょこメンテと一緒に新しいモジュールを試していました。

今週は、既存のデータベースPostgres 7.4.9を最新のPostgres 8.1.1にアップしてみました。
アップデートの手順はWikiの方に記載しました。

前もPostgreSQL 6系列から7系列にアップした際もデータの互換がなくてデータをエクスポート・インポートしたりなど、手間がかかったけど、今回もデータ互換がなくて、同じような手間がかかってしまった。

しかし、Versionが8までくると、かなり完成度も増して、高速な処理ができるようになったらしく、Webアプリケーションを作るのが楽しみに^^;

PHPだけは、このサイトのCMS(XOOPS)の関係でPHP4のままだけど、のちのちPHP5に正式対応するようになったら、PHP5に入れ替えていろいろ試してみたいです^^ノ

投稿者:Hyperdoll 投稿日時:

ノイズ

日曜の早朝(04:00〜05:00)のアクセスの少ない時間を見計らって、新サーバーを正式運用に切り替えをしました。

作業的には
・apache・samba・qmailの稼動を停止
・Webコンテンツ系、データベース系のバックアップ作成
・新サーバーへバックアップファイルの転送
・新サーバーでバックアップファイルのインポート
・両サーバーのIPアドレス切り替え
・新サーバーでapache、データベース・Postfix・dovecotの起動
・Web・データベース・FTP・SSH・メールの接続確認
・外部ネットワークへ公開。

など。。。
こうやって書くと結構簡単そうだけど、実際作業中は手短にミスなく作業を進めないといけないため、結構ドキドキの作業でした。

日曜、月曜と運用していると、先週の試験運用で気づかなかった問題に遭遇。

PCIの拡張スロットにビデオカード(GeForceFX nonFan・PCI仕様)とPromiseのIDE増設カードを挿していたわけだが、どうもこれがお互いにノイズを出し合って干渉しているっぽい。

ビデオカードはDVI接続してるが、画面にノイズがでて、増設分のHDD書き込みが異常に遅いし負荷が高くなってかなり重くなる。
おまけにext3によるCRCチェックでエラーまで出始めている。

急遽、今日の朝一で隣接して挿していたカードのうちビデオカードだけ、一番外側のスロットに移動させ再起動してみると、画面ノイズは消えた。

また調べてみると4台あるHDDのうち、一台のHDDがDMAモードOFFになっていた。
これをDMAモード ON に設定するとHDDアクセスも正常に戻った。

まさかこんなところで問題にぶつかるとは思わなかった^^;
増設HDDには外部に公開しているデータを載せていないので、外部サービスへ影響はなかったが、せめて、先週の試験運用中に発見できればと・・・orz

投稿者:Hyperdoll 投稿日時:

新サーバー もうすぐ

徐々に準備を進めている新自宅サーバーへのリプレース。

ようやく
・WEB apache+PHP+Zend Optimizer
・RDBMS PostgreSQL・MySQL
・Mail Postfix・dovecot
・FTP vsftpd
・ファイル共有 samba
・その他 Teamspeak2(音声チャットサーバー)・DiCE(ダイナミックDNS更新クライアント)・webalizer(webログ集計)
等のインストール・設定が完了した。

あとは細かいチューニングを進めながら、最終運用の構成に向けてHDD増設したり、RAID 1を組んだり、一番慎重になるWebとデータベースのデータ移行を残すところになった。

MySQLとPostgreSQLのデータ移行は、試験的に一回行ったところ、問題なくいけたので、Webのデータ移行ができたと同時に済ませることができそうである。
このサイトを構築しているXOOPS2がMySQLのデータベースを使って運用しているため、Webのデータ移行ぎりぎりまでデータベースも移行できないのが厄介である^^;

データの移行は旧サーバーをとめてHDDを取り外し、新サーバーへ取り付け、新HDDへコピーという手順を踏む予定。

いよいよ週末から来週にかけてが追い込みになりそうである。
と、いっても、週末忙しかったり、私のテンションが上がらなかったら、ずれ込む可能性は大!(笑

投稿者:Hyperdoll 投稿日時: