真のカウンター

トップページにはカウンターをつけています。TOPページのカウントって少ないからサイト全体に対するアクセスを調べはじめました。
Apacheのログをmysqlに投入して、重複IPを削除してカウントしています。perlで作ってあります。

Datea-通常アクセスb-(サーチ)c-ロボットd-ワームアクセス合計acdBlog絵以外の全リクエスト
2010/03/11 132 20 22 0 154 35 660
2010/03/10 310 89 36 0 346 132 1825
2010/03/09 343 126 44 0 387 125 1944
2010/03/08 356 126 31 0 387 99 1684
2010/03/07 346 103 32 0 378 105 1827
2010/03/06 380 120 34 0 414 88 1799
2010/03/05 388 123 45 0 433 101 1824
2010/03/04 330 115 40 0 370 111 1566
2010/03/03 337 113 32 0 369 91 1477
2010/03/02 330 125 23 0 353 104 1558
2010/03/01 302 112 23 0 325 112 1447
Updated at 10:15
・Apacheのログ投入は、毎時30分にsqlへ投入しています。
・同一のIPからのアクセスは1日一回までとして、sqlへの投入を制限しています。
・画像ファイルへのアクセスはカウントしていません。多くなりすぎちゃうから。
・「通常アクセス」がふつうのアクセス。「検索のreferere」を引っぱってきているものはサーチエンジン経由として内訳表示。
・ワームは、system32やdefault.idaやroot.exeを取りに来るやつで、CodeRedとNimdaです。
・ロボットはrobots.txtを取りに来るやつや検索エンジンだとわかるホスト
・サーチエンジンはgoogle(含yahoo),serch.biglobe.goo.ne.jpなど
・右のアクセス合計ではワームやロボットも含まれたカウントです。
・右端の全リクエストは同じ人からの繰返しリクエストも含めたカウントです。
  但し画像ファイルは除きます。
>