メイン

2011年03月25日

qmail smtpエラー

サーバーを入替たらqmailがエラーでsmtpを受付けてくれなくなりました。
rcphostsリスト外の送信先だって事でメーラーがエラーを返します。

ログはこれ
Warning: Could not change directory to '/var/spool/relay-ctrl/allow': Permission denied.

Warning: Could not open current directory: Permission denied.
これ。
Permissionやらユーザー設定をいろいろ変えましたがようやく解決策がわかりました。というか問題がはっきりしました。

relay-ctrl-3.1.1 最新版は、ディレクトリの使い方がちょっとかわってたところ、そしてSMTPもPOPも、起動スクリプトに一つパラメーターを追加しないとだめなところ、が原因でした。
バージョン変更でちぐはぐになってたので

こちらのサイトを参考にさせていただきました。

# mkdir /var/spool/relay-ctrl
# mkdir /var/spool/relay-ctrl/allow
# chmod 700 /var/spool/relay-ctrl
# chmod 777 /var/spool/relay-ctrl/allow
# mkdir /etc/relay-ctrl
# echo "/var/spool/relay-ctrl/allow" > /etc/relay-ctrl/RELAY_CTRL_DIR

このへんの記載がかわってるわけですね。

2011年02月10日

MovableType バージョンアップ不能

このBlog ・・・ MobableTypeのたぶん3.2なんだけども、ver 5にあげようと思ったところ、Perlのバージョンが合わないので、しかたないのでひとつ前の4にバージョンアップ、をトライしました。
具体的には4.28
で、インストールしてmt.cgiにアクセスすると

Got an error: Can't locate object method "install_properties" via package "MT::Tag" (perhaps you forgot to load "MT::Tag"?)


と表示されてそれ以上なにもできない。

これに関する情報が検索してもほとんど無く、現在類似の案件でみつかるのは
日本で1件、未解決。
海外で2件、いろいろインストール方法を変えて試してみたが結局解決せず類似の状況の方が数名名乗りをあげるもそのまま未解決。

クリーンインストールはデータベースをいじりたくないので試してみてませんが、3.2からアップ、という事の手順で出来ることをある程度条件を変えて試してみました。
ファイルを消したりUPしたり、といろいろやってみましたが、結局のところ上記のエラーというか警告というか、この表示より先に進むことはできませんでした。

とりあえず記録だけここに記します
結局待避してあった3.2のディレクトリごと、もとの通り配置しなおして、あきらめた状態です。

mt-check.cgi を実行してみても特に注意される環境とか出ないんですけどねぇ~
上記の海外のトラブルシュートのスレッドでも同じコメントされてますねぇ。

2010年04月06日

サーバーのハードディスク、いかれる

また だ・・
またメールサーバーが故障しました。
2010/3/21に書いたばかり。

Turbo Linux 11 Server

メール送受信が出来なくなったという事で、会議の途中でみてみると確かにメールが反応しない。
WEBは見えてる。 sshはつながらない・・・

という事で、サーバーに直結してるモニタを見にいったら
sda とか i/o だとか fail だとか、エラーらしき文字が画面の下から上に流れつづけ・・・
こりゃまた面倒な事に・・・・

表示されている文面は今となっては覚えてません。だいたいそれを見たらまずは復旧に全力投球なもんですから。
とりあえず、一旦リセットしてみると、起動してしばらくは動作する様でしたが、少し経つとぽつりぽつりと同じ表示が。

結局ディスクがいかれたってことです。
表示にsdaって出てるからメインのドライブだな。今sda sdb sdc の3機が接続してあるから。

このサーバーは、RAID-1で組んだのでsdaがエラーって言うと、RAIDの1番目のドライブかぁ
なんでsdaなんだか?
RAIDだったらデバイスは /dev/ataraid ってのじゃないかな?
嫌な予感が少し走る。

もう、shutdown も受け付けてくれず、強制停止させて、ドライブの1番を外します。
SATA Seagate Baracuda 7200.10 80G

このままでsdbから立ち上がるのがRAID-1だろ、そしたらあとはRAIDを再構成するだけ。
立ち上がるか?
スイッチON

立ち上がったけど、プロンプトのサーバー名が localhost ってなってるのはなんで?

その答、せっかくRAID-1をセットしたのに、ミラーされてない。全くデータが書き込まれてない。
ハードウェアRAIDなのになぜか一番最初にRAID設定してduplicateした直後の状態。
だからsdaなのか・・・

うーむ
そうなると、簡単に復旧出来ないわけだ。
まいったな

と思いましたが、この前仕掛けたUSBドライブへ一日一回自分自身を転送するように仕掛けたもの、これが頼みの綱。
運良くLinuxでの起動は出来るので、あとは環境を戻すだけ。

sdbをメインにして、起動させて、mkdir /mnt/usbでusbドライブのマウントポイントを作って、
mount /dev/sdb1 /mnt/usb
でマウント。と思ったらsdb1はbootパーティションだった。
sdb3 が / ルート
mount /dev/sdb3 /mnt/usb

でそのusbドライブの中にあるコピースクリプト

rsync /tmp/ /mnt/usb/tmp -avzrpog --delete
rsync /home/ /mnt/usb/home -a -v -z -r -p -o -g --delete
rsync /var/ /mnt/usb/var -a -v -z -r -p -o -g --delete --exclude 'chroot/proc'
rsync /bin/ /mnt/usb/bin -avzrpog --delete
rsync /dev/ /mnt/usb/dev -avzrpog --delete
rsync /etc/ /mnt/usb/etc -avzrpog --delete
rsync /lib/ /mnt/usb/lib -avzrpog --delete
rsync /opt/ /mnt/usb/opt -avzrpog --delete
rsync /root/ /mnt/usb/root -avzrpog --delete
rsync /sbin/ /mnt/usb/sbin -avzrpog --delete
rsync /usr/ /mnt/usb/usr -avzrpog --delete

これを取り出して、コピー元と先を入替て復元用に。
そして実行。

データを書き戻すこと約30分、そして再起動。

Oh
無事最新のバックアップが7時間前の自動実行時。そこに戻りました。

危ない危ない。
特に何も調整することなく全く今までと同じに動作しています。

qmailでのメールの置き場である /homeだけは1時間ごとにバックアップするようにかえました。
RAIDもこの際やめました。この前の段階でRAIDはやめる方向で決意したんですけどね。

めでたしめでたし。

2010年03月21日

Linux Mail Server 引っ越しの話

今年に入ってから2台、メールサーバーの交換をしました。

まずは1台めの話
このメールサーバーは他社内で活動しているもので、現物は手元にありませんし簡単に行けるところではありません。場所が遠いっていうことですね。
TurboLinuxServer7+qmailでの運用です。
年明けに何らかの理由で再起動したところが発端ですが、立ち上がらないと。
遭遇したことのある人はわかると思いますが、パスワードを入力してメンテナンスするかCTRL+Dで通常起動するかの選択を迫られる画面で停止。表示はわすれてしまいましたが・・
ここで通常はメンテナンスモードに入り、たいていの場合
df やら mount 、みられれば /etc/fstab とかみて使うべきマウントポイントを確認して
e2fsck
でチェックして、また、同時に init 1とかでシングルモードになったり
アンマウントしたりでいろいろやって完了、って感じなのですが、これを遠隔でやってもらいましたがどうやらダメらしい。kernel panicが表示されるようになった。HDDがいかれたか・・・
となると問題はRAID1の両方やられた可能性が大
RAID1の弱点は故障したドライブに引っ張られて両方だめになる事、ときどきあり。
もうこのディスクはLILOがLIしか表示しなくなってもう起動しようとしない。LILOの修復もいろいろ調べてみたがどうやってもうまく動かないのでHDDのBOOT情報関連が故障という事なんでしょう。
幸いなことにHDDの中身は見えるのでBOOT以外は生きてる様子。
こちらのユーザーさん、50人くらいでしょうか、早く対処しないとこりゃ困るよね。
という事でとりあえず手元にある昔のHDDに当時のままのOSやらqmailやらインストールしなおして、その壊れたHDDをマウントしてrsyncをつかって/home以下と/etc/passwe /etc/group を移して、移されたマシンのpasswdを少し整合性確認してなおして応急復旧。
あとはちゃんとしたハードで組みなおして、OS突っ込んでデータを移行する、ってプランでいきましたが、今のハードに当時のTurbo7関連はインストールできません。チップセットとか対応してない様で。
てなわけで、TurboLinuxServer11で作ってqmailのインストールはあちこち変えてないとmakeできないのですが、それも以前から準備してあるのでそれなりに直してある状態からインストールして、/home以下を移す作業は同じで・・・と思ったのですが、qmailが動作しなかったので make setup checkだけやりなおして完了。注意点は/var/qmail以下の所有者とオーナー、これが狂ってると動作しない。

さて、今回は自前のメールサーバー。ユーザーは100人弱。
これももう8年ノンストップのTurboLinuxServer7
アンチウィルスのアップデートモジュールが動かないから、という理由で何かのモジュールをアップしたのですが、まあせっかくだからと、Turbopkgを使って一気にアップデートしたら多分kernel関連も変わった?
/lib/modukesにいろんなバージョン混在しててうまくバージョンが読めてない感じ
でもそのまましばらく運用していましたが、このサーバーでは珍しくフリーメモリが徐々に減ってきた。だいぶ減ってきたところで、ほんとに珍しく再起動することに。何ヶ月ぶりか?
としたところ、すでにこの前のアップデートでやられてたんですね。LIしか表示せずLILO読めず。
これに対してもいろいろ手がけるも、起動には至らず、RAID-1両方アウト。約1日かけてあきらめるに至る。でもこれもHDDからデータは抜けるのがわかりまずは一安心。
TurboLinuxServer11でほぼ完成形に近い予備を作ってあったのでそちらに切替える事に。
これはIPだけ変えればいけるようにしてあるのでそれをやって、あと/home以下とユーザー情報を移せればまずはOK。あとはどうにでもなるもんで。
で/homeの移行はHDDをマウントしてrsyncで移す。あとはpasswdなんだけどこれが今回厄介で、qmailのユーザーとかぶる。ユーザーのIDを変えればよかったんですがうっかりqmail関連のユーザーをいじったもんだから一苦労。再インストールとかいろいろやってもうまくいかず。そして全部消してやり直せれば良かったんですが、すでに一部のキューがなんかのひょうしにたまってる。キューを消さずにすべてを動かすって、なんか猛烈に大変。たまってるキューを qmHandleでファイル名をしらべてfindコマンドで場所を特定してchown,chgrpをかけていく。持ち主がちゃんとなおせれば正常に動作しはじめますが、これやってて結局、半日かかった。まる1日のメール停止状態。これはけっこうきつい。

こんどはどっちのサーバーにもRAIDはやめました。起動できるドライブを作っておいて、slaveにつけて、cronで一日一回、すべてのファイルをrsyncでコピーする。これでいつでも交換して予備に切替えられます。

2010年03月16日

[named]unexpected RCODE (REFUSED) resolvingについて

サーバーを作り直したらnamedから

Mar 15 03:26:06 ns named[32614]: unexpected RCODE (REFUSED) resolving 'zzz.xx.yyy.ww.in-addr.arpa/PTR/IN': aa.bb.cc.d#53
Mar 15 03:26:11 ns named[32614]: unexpected RCODE (REFUSED) resolving 'zzz.xx.yyy.ww.in-addr.arpa/PTR/IN': aa.bb.cc.d#53
Mar 15 03:26:33 ns named[32614]: unexpected RCODE (REFUSED) resolving 'zzz.xx.yyy.ww.in-addr.arpa/PTR/IN': aa.bb.cc.d#53

が定期的に出てくるようになった。
Googleでなかなか原因にたどりつけないが、つまるところ named.ca に記載したホストのIPが有効でないという結果のようでした。
BとLが変わってる様で

B.ROOT-SERVERS.NET. 3600000 A 192.228.79.201
L.ROOT-SERVERS.NET. 3600000 A 199.7.83.42

これがたぶん現行のIP
直したら消えました。

2008年08月22日

PowerChuteの動作しているLinuxのコントロール

備忘録です
LinuxにPowerChuteを導入し停電時のシャットダウンをする際に
agentだけはLinuxに入れられますが、コンソールはWindowsでないと使えないのでLinuxの近くにWindowsが必要ですが、Linux単体でなんとかしたい場合は
http:// サーバーIP :3052/
で開けて、ある程度の管理設定が出来ます。イベントメールも送れるような機能が使えます。

どこかのサイトで見かけた情報ですが、その場所がどうしても見つけられないので個々に備忘録として書いておきます。

2008年08月05日

Turbolinux 11 server

このサーバーはTurbolinux 7 Serverです。もう古いOSだけど手になじんだところが思うように扱えるところ。インストーラーも自分の気持ちにとても近いので気に入ってます。Linuxってディストリビューションによってインストーラーのクセが違うのでその微妙な違いが嫌なんですよ。
同じOSのサーバーが予備機を含めて、6機あります。
さすがにこのOSがサポートしているパーツ類、ドライバの入手が困難になってきたのでそろそろ新しいものを考えないと、と思っているのが一つ。
もう一つはTurbolinux7でもTurbopkgでアップデートをすると、いくつかのデーモンが最新になる事により当時のものとは互換性が無い状態がでてきてそろそろここでも新しいものに統一する時期か・・・
と思っていましたが、Turbolinux 11 Serverが最新版。ずいぶんと進んだNoだ。
7以降有償になってましたが、この11からフリーダウンロード版が提供されていますので、試しに使ってみてはいかがですか?
早速こちらを使わせて頂きました。久々に手を出したら思わぬところでいろいろてこずってます。

まずはダウンロードしたファイルからCDを焼く。
.iso の拡張子のファイルからCDを作る場合CDライターでちゃんとCDに展開しないとだめなんですが、isoファイルがCDに書込まれたのではダメ。B'sのレコーダーでやったら、右の窓に入れて書いてもファイルがそのまま記録されるだけだったので、左の窓に入れて成功しました。CDを数枚だめにした。

CDができてしまえばインストールはすんなりです。CDでブートして・・・・って。
サポートしているドライバも増えたし意外と快適。インストーラーは手になじんだものそのまま。

で、

TELNET、はもう入ってないんですね。今や使わないってことかな。

makeでコンパイルするとlibc.so.6で引っかかります。とにかく引っかかる。
詳しく詰めてる時間がないのでこちらのを参考にさせて頂きました

namedで/var/named/以下に置いたzoneファイル。これが見つけて貰えなくなた。置き場所を
/var/named/chroot/var/named/
ここに置かないとダメ

Apacheは言語モードがデフォルトで設定されていたので日本語は文字化け
AddDefaultCharset UTF-8
の行をコメントアウトして対応

なんてところが思わぬ障害でしたが、まあなんとかクリアしてきてます。
squidやmySQLなんかもはじめから入ってるみたいなので思ったより便利。
パフォーマンスなんかは・・・まだそこまで試してないけど、OS以前にマシン自体が昔のものより相当良くなってるので上がって当たり前ってところもありますが・・・・・

というわけでしばらく調整してます。・・・あ、この11のマシンはこのサーバーでなくて仕事用のまだテスト機ですが・・

2007年04月25日

サーバー故障からの復活

ちょっと前にサーバーが故障しました。M/Bでしょう。全然起動しなくなってたから。
しかたなく予備のサーバーに切替えたら、昨年の9月までさかのぼっちゃいました。
動かないよりいいか・・・と思いつつぼちぼちと直しに入ってたのですが
本日、ようやく環境復旧が済みました。
結局のところ、新たに予備サーバーをたてるとこからはじめ、そこに、壊れたサーバーのHDDをくっつけます。そこからこんどメインになったサーバーへ必要なファイルを持ってくるって事で対応します。
どんな風にもってくるか、がミソ
まず、前述通り予備マシンに壊れたサーバーのHDDをくっつけてマウント
 mkdir /mnt/old
とか適当にディレクトリを作っておいて
 mount -t ext2 /dev/hdc3 /mnt/old
って感じでマウント。
メインサーバーがデータを引っこ抜くのですが、ネットワーク経由でファイルを転送するので事前にscpやrsyncが使える様にキーセットを作っておきます。(以前書いたバックアップの解説のところ参照しました)
で、
scp 10.0.0.5:/mnt/old/var/www /var -rf
ってコピーしたのですが、これだとパーミッションが書き換わっちゃたりオーナーも全部rootになっちゃうからあとが大変。FTPやら、このBlogなどのcgiが書き込めなかったり、mysqlの設定とMovabletypeのデータが違ってておかしくなってたりと、大変。
ぜひ属性を変えずにディレクトリを持ってきたいもんだと思ったら、rsync、やるじゃん。
rsync -avx -e ssh 10.0.0.5:/mnt/old/var/www /var
ってな具合で、ガガーっとすんなりおんなじ構成にしてくれるって、おみごとです。
久々にlinuxのシェル触った・・・・・

2006年09月08日

サーバーIPの引っ越し

Bフレッツが使えるようになるらしいので、申し込んであります。
あ、会社の話しね。

それに伴いサーバーのIPも変更しなければならないので、前の記事をみながら改めて準備をしています。その時の記録はこのページの013番にある・・・この記事
ADSLからBフレッツに変えるとIPも変わるんですね。あたりまえだけど。

変更依頼はメールで送りますが何通かメールでやりとりをして即日書換えが済
んだようです。名づけてねっとですが、仕事が早い。
書換え後世界中に情報がまわるまでタイムラグが72時間くらいと言われているので少し早めに手続きしたんです。でもその晩、20時頃には新しい情報が流れはじめてきました。自前のXPの通常のインターネットからは既にドメインから引くIPが新しいものになってしまいました。だからサーバーにアクセスできなくなってしまいました。ちょっと反省。でもLinuxからは新しいIPじゃなくて、古いIPを持ってきてるので(キャッシュはリセットしてもです)はちゃんとセカンダリサーバーを見てくれてるみたいなのでメールのSMTP転送はできてます。まあそれはそうとして、時系列でまとめます。

9/13(水)
 Bフレッツ工事
 朝から工事をやってたけど結局なんかの故障らしくて当日は稼働できませんでした。
9/14(木)
 そのなんかの電柱の部品を交換対策したらしく、朝一番で使えるようになってました。

 では引っ越し本作業を一気にかきます。
 ルーターを設定してフレッツ経由でプロバイダに接続出来るように変更しました。
 フィルタ関連とか、今までの設定をみながらちょっとチューニングした程度。
 接続できるのを確認したら、サーバーの操作。
 /etc/sysconfig/network でgatewayを新しいIPに修正
 /etc/sysconfig/network-scripts/ifcfg-eth0 のIPとネットワークとブロードキャストを変更
 /etc/named.conf で転送先サーバーとマスターサーバーのIPを確認して修正、
   これについてはセカンダリサーバーにも実施
 /var/named に入っているプライマリサーバーとしてのzoneファイルを修正、IPをしっかりと確認して。
 /etc/http/conf/http.conf ここにvirtual hostの設定に関して、IPが書いてあるのでそれを修正

以上を直したら、再起動。その前にEthernetケーブルを光系のルーターに接続しなおしておきます。

これで起動させたら、セカンダDNSにzoneが転送されている事、httpサービスができている事、メールの配送などを確認してうまく動作してないところを微修正してほぼ完了。特に問題なく引っ越しが済みました。
もう一つやること。レジストラのDNS設定。
使うドメインに対するネームサーバーを変更します。オンラインで登録する2つのサーバー、これを直しておきます。

以上でサーバーの引っ越し完了、だけど、実はもう一台、このサーバーが済んだあとに引っ越しを予定しているので、そちらはここで書いた一台目の反省をふまえて進めました。

2台目のサーバー引っ越し作業=すなわち反省をフィードバックした手順
まずは上記のファイルを一通り修正しIPを変えて起動させます。
セカンダリサーバーに新しいzoneが転送されてればもうほとんど大丈夫。普通に使える状況です。
その後に、手作業で修正するネームサーバー変更依頼や、レジストラのデータを直したり、そんな事をあとから追ってやりました。こっちの方は順調そのものでタイムラグは15分くらいじゃなかったかと思います。
あと逆引きの名義書換えも後から依頼して実施です。
 
そんな感じ。あれこれ気を使った割には結構簡単に済んだのでした。

2006年02月15日

やっぱりPHP

Wordpressを使っているとメモリが減少してしまうことはここ何度か書きました。
Wordpressというよりは、PHPなんです。
昨晩よりPHPを止めてみました。当然Wordpressのページも開けない状態で。
するとメモリの不要な減少は無くなりました。
一定の数値をkeep
当たり前なんだけどね。PHP と相性悪いなぁ。
なんか原因あるんだろうけど、もともとPHPってあまり好きじゃないからまぁいいかな。
とりあえず少しの間、またPHP復活させてみますが、ターゲットが明確になって良かった良かった・・・。

2006年01月21日

サーバーのメモリ減少現象?

このwordpressを稼働させてから使えるメモリが日増しに減少する現象に陥っています。
時間とともにすこーしずつ減ってくんですねこれが。
そしてゼロになるとフリーズします。もちろんスワップ領域も使い切っちゃってからです。
Linuxのフリーズってかなり動揺しますよ。なにもできなくなるコンソールって悲しすぎる。

wordpress自体別に問題ないと思うけど、MySQLもずっと前から使ってたし・・・・・って考えるとPHPかなぁ。PHPを稼働させたくらいしか違いはありません。
そう考えるとBlogはMovableの方に変えていったほうが安定してていいかなぁ~とも思ったりします。
とりあえず自分自身で使えるメモリを監視させて「もうだめ!!」っていう状態になったら再起動する様にしておきました。
このサイトが見えないときはそんな時です。


今日は東京は雪、ここのところ新潟も毎日大雪、で、ここ群馬県では雪って全くふりませ~ん。

2005年12月01日

Down

今日は午後からこのサーバーがダウンしてました。
検索された方、すいません。メモリ不足って事です。

2004年12月01日

サーバー交換 今度はRAID-1だ!

もう古いM/Bはやめた。といっても次のも古いけどね。

スペックがよくわからないけどPentium 800MHzくらいのやつです。

Promise fasttrack 100 TX2 ってのを使ってハードウェアRAIDにしてあります。

このPromiseはTurbo Linux 7 Serverのインストーラーで勝手に認識されるから便利だったんだよね。

2004年11月28日

サーバーが故障するので交換しながら直してみるものの 小手先の修理だからすぐ壊れる事件続出

ずっとまえにサーバーの写真を載せたと思うけど、DELLのOptiplexを3台、予備を運営しながら使っています。

スペックは pentium 133とか166とかその当時のマシンで、RAMは32とか64Mくらいで、あまりよく覚えてません。

その当時のM/Bの制約からHDDはたぶんMAXで6Gくらい。もうそんなの手に入らないよ。

だからHDDが壊れたらもう使えない。



さて、そんな中で、あの地震の日、新潟の。ちょっと停電したからそのせいかもしれないし、震度5だったのでその揺れのせいかもしれないし、地震の電磁波でいかれたのかもしれない。その時からまともに動作しない。停電といってもUPS入ってるから直接影響ないんだけどね。ADSLが止まったあとなかなか復帰しないので、NTTへ連絡を・・と思っていたら自分のサーバーだった。

要はHDDのAllocation Tableがおかしくなって記録に関して障害が出てる。

しばらくだましながら使ってたけどやっぱりだめなので、予備に切替えて仕上げました。そんな事に費やすこと2日。

そのご順調に動作してると思ったら、こいつもおかしくなって・・・・・・

その間にまた予備マシンを仕上げておいて、こいつをメインに・・・・・

と思ったらこの昇格させた予備マシンがまたまたおかしくなる兆候。

もう何がなんだかわからないけど、手元のHDDがみんな変なんだよ。



今日は11月28日。

で、密かにHARDWARE RAID-1 への切替えを準備中なんだ!

もうDELLはあきらめて次ぎはRAIDマシンにします。Gatewayのマシンで810の載ったP800Mくらいのやつね。やっぱり古いね。

2003年09月10日

crontab

crontab -e

このコマンドでcronの設定をしますよね!

ぼーっとしていると何をするかわかりません。

crontab -r

全部消えてしまいました。cronの設定。

2003年08月27日

サーバーの時計

サーバーの時計にはソフト時計とハード時計があります。Windowsでは両者が同一になっているのであまり気にしてませんでしたが、Linuxはそれぞれ別に管理されています。表示方法は、コンソールから

 date でソフト時間

 clock でハード時間

ですね。

さて、最近、どうもcronの仕事が遅れる様になってきました。毎時間、NTPサーバーと同期もとっているし、ちゃんと時間も合っているのにもかかわらず遅れが出てくるのです。

そうなるとcronはハード時計を採択しているとしか思えません。とにかくなんとかしたいものです。

対策は簡単ですね。

crontab -e で

cronの仕事に

 /sbin/clock -w

というのを追加して、ハード時計をソフト時計に勝手に合わせるようにしました。

ただそれだけのことですが。

2003年04月07日

故障その後

なんとかSQLやApacheの修復は終えました。故障前との整合はほぼ完璧。
但し、qmailに使っているtcpserverが認証に時間をかけてくれて、MTAへのログインがめちゃくちゃ遅くなってしまった。
HUBやらなにやらといろいろチェックして、最終結論がでたので、サーバー記事の方にまとめておきました。こっち
linuxのバージョンの違いによる動作の違いの様ですが解明するまで結構かかりました。

2003年04月06日

サーバー故障(重症)

4月2日のEthernetのところで書きましたが、サーバの不調は本当だった様です。
本日夕方帰ってメールをチェックしようとしたら、ログインできません。
さてさて
・・・WEBはなんとか動作しているけど、レスポンス遅い。
・・・TELNET不能
・・・ローカルコンソールでもログイン不能
・・・再起動してログインするも、・・・ping不能、というか1分くらい送れて反応
・・・とにかく反応が遅い
マシンのせいか、HDDごとおかしいのか切り分けないと。
故障サーバーのそのHDDを2号機に入れて起動させてみるも、変化無し。すなわち、HDDごと動作不良。
ローカルコンソールでログインさえできれば、ファイルは見られる状態。
パケットが飛ばない、または異常に異常に遅い。サービスは起動しているも、メールは不能、Telnet,SSHは不能。
設定をチェックしても異常なし。異常アクセスの痕跡も無し。

というわけで今日はもうあきらめました。
影武者2号機を出動しました。
いくらミラーと言ってもいろいろな設定を施していなかったので、そのまま使うにはちょっと大変です。
モジュールの不足分を調べてひとつひとつ足して行かねば。

現在2号機がまともに動かないところは
 ・メールのログインに時間がかかる
 ・SQLが投入できない。読み出しはできるようになった。
 ・あとは・・・また調べましょう。