真のカウンター

トップページにはカウンターをつけています。TOPページのカウントって少ないからサイト全体に対するアクセスを調べはじめました。
Apacheのログをmysqlに投入して、重複IPを削除してカウントしています。perlで作ってあります。

Datea-通常アクセスb-(サーチ)c-ロボットd-ワームアクセス合計acdBlog絵以外の全リクエスト
2012/02/07 154 18 20 0 174 68 1226
2012/02/06 372 112 42 0 414 199 2894
2012/02/05 361 113 42 0 403 143 3106
2012/02/04 341 78 26 0 367 113 2753
2012/02/03 462 115 35 0 497 141 3055
2012/02/02 377 114 38 0 415 152 2630
2012/02/01 386 94 30 0 416 130 2699
2012/01/31 411 108 31 0 442 160 2802
2012/01/30 323 117 28 0 351 157 2632
2012/01/29 326 88 39 0 365 137 2305
2012/01/28 311 93 41 0 352 127 2403
Updated at 10:45
・Apacheのログ投入は、毎時30分にsqlへ投入しています。
・同一のIPからのアクセスは1日一回までとして、sqlへの投入を制限しています。
・画像ファイルへのアクセスはカウントしていません。多くなりすぎちゃうから。
・「通常アクセス」がふつうのアクセス。「検索のreferere」を引っぱってきているものはサーチエンジン経由として内訳表示。
・ワームは、system32やdefault.idaやroot.exeを取りに来るやつで、CodeRedとNimdaです。
・ロボットはrobots.txtを取りに来るやつや検索エンジンだとわかるホスト
・サーチエンジンはgoogle(含yahoo),serch.biglobe.goo.ne.jpなど
・右のアクセス合計ではワームやロボットも含まれたカウントです。
・右端の全リクエストは同じ人からの繰返しリクエストも含めたカウントです。
  但し画像ファイルは除きます。
>