真のカウンター

トップページにはカウンターをつけています。TOPページのカウントって少ないからサイト全体に対するアクセスを調べはじめました。
Apacheのログをmysqlに投入して、重複IPを削除してカウントしています。perlで作ってあります。

Datea-通常アクセスb-(サーチ)c-ロボットd-ワームアクセス合計acdBlog絵以外の全リクエスト
2008/07/26 138 26 15 0 153 56 1396
2008/07/25 300 89 15 0 315 104 2737
2008/07/24 271 81 18 0 289 77 2292
2008/07/23 372 123 13 0 385 103 2880
2008/07/22 323 117 22 0 345 90 2139
2008/07/21 282 89 30 0 312 88 1917
2008/07/20 257 76 20 0 277 101 2311
2008/07/19 290 77 22 0 312 96 2013
2008/07/18 354 97 24 0 378 88 2343
2008/07/17 334 82 30 0 364 99 1915
2008/07/16 0 0 0 0 0 0 0
Updated at 11:45
・Apacheのログ投入は、毎時30分にsqlへ投入しています。
・同一のIPからのアクセスは1日一回までとして、sqlへの投入を制限しています。
・画像ファイルへのアクセスはカウントしていません。多くなりすぎちゃうから。
・「通常アクセス」がふつうのアクセス。「検索のreferere」を引っぱってきているものはサーチエンジン経由として内訳表示。
・ワームは、system32やdefault.idaやroot.exeを取りに来るやつで、CodeRedとNimdaです。
・ロボットはrobots.txtを取りに来るやつや検索エンジンだとわかるホスト
・サーチエンジンはgoogle(含yahoo),serch.biglobe.goo.ne.jpなど
・右のアクセス合計ではワームやロボットも含まれたカウントです。
・右端の全リクエストは同じ人からの繰返しリクエストも含めたカウントです。
  但し画像ファイルは除きます。
>