真のカウンター

トップページにはカウンターをつけています。TOPページのカウントって少ないからサイト全体に対するアクセスを調べはじめました。
Apacheのログをmysqlに投入して、重複IPを削除してカウントしています。perlで作ってあります。

Datea-通常アクセスb-(サーチ)c-ロボットd-ワームアクセス合計acdBlog絵以外の全リクエスト
2010/07/31 283 96 34 0 317 62 2048
2010/07/30 344 151 37 0 381 111 2284
2010/07/29 301 145 42 0 343 126 3318
2010/07/28 358 157 50 0 408 118 2426
2010/07/27 337 175 51 0 388 158 2561
2010/07/26 321 135 58 0 379 128 2676
2010/07/25 301 110 74 0 375 89 1906
2010/07/24 242 96 45 0 287 123 1894
2010/07/23 288 118 37 0 325 101 1628
2010/07/22 328 140 39 0 367 103 2057
2010/07/21 355 173 40 0 395 118 1889
Updated at 21:30
・Apacheのログ投入は、毎時30分にsqlへ投入しています。
・同一のIPからのアクセスは1日一回までとして、sqlへの投入を制限しています。
・画像ファイルへのアクセスはカウントしていません。多くなりすぎちゃうから。
・「通常アクセス」がふつうのアクセス。「検索のreferere」を引っぱってきているものはサーチエンジン経由として内訳表示。
・ワームは、system32やdefault.idaやroot.exeを取りに来るやつで、CodeRedとNimdaです。
・ロボットはrobots.txtを取りに来るやつや検索エンジンだとわかるホスト
・サーチエンジンはgoogle(含yahoo),serch.biglobe.goo.ne.jpなど
・右のアクセス合計ではワームやロボットも含まれたカウントです。
・右端の全リクエストは同じ人からの繰返しリクエストも含めたカウントです。
  但し画像ファイルは除きます。
>