mozIStorage***を使って、ベイズ判定を書き起こしてみました。 汎用ベイズ判定のソース(Gary Robinson ... mozIStorage***を使って、ベイズ判定を書き起こしてみました。 汎用ベイズ判定のソース(Gary Robinson 前期型) もちろん、データベースは学習データの記録に使っています。 あ、汎用というのはスパム/ハム選別以外にも使うことを想定しているからで、たとえば、「このサイトはアレゲ指数0.89だから、かなりアレゲだな」などという使い方ができます。あらかじめ、アレゲなサイトとそうでないサイトを学習させてやるのが大変かもしれませんけど。 使ってみた感想は、精度は予想よりかなりいいです。スパムフィルタリングのように真剣な用途だと、false-negativeを気にして片面95パーセントなど、カリカリのチューニングが要求されますが、遊びで使う分には、学習数がそれほどなくても、かなり直感と合う数字を返してくれています。後述のように、Thundebirdのよりもアルゴリズムでは劣っている
記事へのコメント0件
このエントリーにコメントしてみましょう。
注目コメント算出アルゴリズムの一部にLINEヤフー株式会社の「建設的コメント順位付けモデルAPI」を使用しています