ノイズがすげぇ

これも一つの結果として集計するか、人為的にスパム日記っぽいものを省くか・・・・・・・。どうしよう。

一つの案として

30日以上日記を書いてないサイトはXにする、とか。

ユーザー登録から本日までに日記をつけた日数:1日

http://d.hatena.ne.jp/hirasimo207/about

これも結局いたちごっこではあるのだが・・・。スパマーが30日以上日記を書くスクリプトでも組んでれば終了だし。

やっぱりさ、ユニークIDを抽出する仕組みを作って、id名、タイトル、日記をつけた日数を集計することにしたいのですわ。