POPFile
John の引退宣言を受け、プロジェクトが再び動き出した。 プロジェクトが決めなければならないことは、主として以下の 2 点。 新しいリーダーを誰にするか POPFile の今後(バージョン 2)をどうするか リーダーについてはまだなんとも言えないが、バージョ…
Mac OS X 版を作成した。日本語化プロジェクトのファイルセクションからダウンロード可能。
POPFile 1.0.0 がリリースされた。待望の「バージョン 1」である。以下はリリースノート(日本語版)。 POPFile v1.0.0 へようこそPOPFile はナイーブ・ベイズ法を利用したメール分類ツールであり、POP3、 SMTP、NNTP の各プロキシと IMAP フィルタ、ウェブ…
公開されてからすでにしばらくたってしまっているが、本家フォーラムにて POPFile 1.0.0 RC6 が公開されている。前のバージョンからは、同梱されている Perl のバージョンがあがったこと、IMAP モジュールが更新されたことなどが主な変更点。 今回のバージョ…
Mac OS X 版も公開(POPFile で使用するためのMeCab のインストーラも)。今回から、開発(?)環境が Leopard になったためインストーラパッケージの作成方法を変更した。これまでは PackageMaker の GUI 版を使ってその都度作成していたのだけれど、だんだ…
昨日 RC1 の話を書いたばかりだが、少し前に RC2 が公開された。 RC1 からの変更点は、テスト中の IMAP モジュールの内容が更新された(機能的には変更なし、エラーチェックコードが追加された)こととリリースノートが更新されたことのみ。1.0.0 リリースに…
本家フォーラムにて、POPFile 1.0.0 RC1 が公開された。 POPFile はこれまで長い間 0.x.x というバージョンで公開されてきたが、十分安定しており、もうベータ版と呼ぶのはふさわしくないだろうということで、ついにバージョン 1 としてリリースされることと…
POPFile を快適に使うためのメモ というものを書いてみた。動作速度の改善や安定性の向上など。これまでところどころで断片的には触れてきたことはあったが、あまりまとまっていなかったと思うのでまとめてみた。データベースの最適化と日本語パッチの適用で…
先着8,888名にライセンス無償配布のキャンペーン中です。サポートは受けられないということですが、spam 対策に特化されていて初心者でも使いやすくなっています。
テスト版その 1 からさらに高速化を行い、他のバグを修正したテスト版その 2 を公開した。 テスト版その 1 からの修正点は、 さらに高速化 0.22.5 より 1.8 倍くらいの高速化を実現した(適当に選んだ 500 通の分類テストによる)。 大きなところでは、これ…
id:amatubu:20070720#p1 でパッチを公開してからずいぶん時間がたってしまったが、ようやくパッチのインストーラを公開できた(MeCab 0.96 を含めたインストーラは、Mac OS X 版/Windows 版)。 パッチ自体のインストーラ(Mac 版)についてはこれまで通り…
昨日の高速化と分かち書きプログラム切替パッチ、細かいバグ修正をまとめたパッチを POPFile 0.22.5 日本語パッチとして公開した。これで POPFile の次のバージョンで実現したいと個人的に考えていた項目はすべて準備できた。パッチの内容の詳細は以下のとお…
単語抽出部分を見直す 0.22.5+分かち書きパッチのプロファイルで、Classifier::MailParse::add_line で時間がかかっていることがわかったのでこの部分の最適化を考えてみた。まずは、前回にも書いた、単語抽出部分を見直してみる。具体的には、 while ( $lin…
POPFile 0.22.2 から 0.22.3、0.22.4 から 0.22.5 のバージョンアップにおいて少しずつ細かな速度向上を図ってきたが、実際にどの程度の効果があったのか調べてみた。 テストには最近受信したメール 500 通を用い、POPFile に付属の bayes.pl スクリプトでメ…
POPFile が SourceForge.net の Community Choice Award にノミネートされています。(Best Project for Communications カテゴリ)投票は 7 月 20 日締め切りです。POPFile を使ってくださっているみなさん、ぜひ投票をお願いします!POPFile に投票するに…
分かち書きに文字種による分割を使った場合でも分類精度はほとんど変わらないという結果が得られたので、POPFile 0.22.4 のときに公開していたパッチを若干修正して、分かち書きに MeCab、内蔵パーサ(文字種による分割)を使うためのパッチとして再公開。 …
ずいぶん間が空いてしまったが、ようやく TOE と TA の精度比較の結果をまとめることができた。 POPFile は TOE(間違ったときだけ鍛える)というポリシーで使用することがすすめられている。これは、POPFile がメールの分類を間違えたときにだけ UI を開い…
id:amatubu:20070524 の続きの続き。テストに使ったデータを修正して再挑戦。結果の詳細。 結果は、なんと、22,340 通のメールを分類させ、Kakasi 270 通、文字種による分割(simple) 270 通、MeCab 269 通の分類ミス(精度では 98.791%、98.791%、98.796%…
POPFile 停止(UI から)、アーカイブの内容を POPFile のプログラムフォルダへ unzip で展開、POPFile 起動(sudo /etc/init.d/popfile start)で完了。 結局、稼働時間は 322.92545393518518518518 日であった。ほぼ 323 日。
id:amatubu:20070524 で書いた精度比較の続き。 あるところをピークに精度が下がってしまっていることがやはり気になり、テストに使ったデータを調べてみたところ、元のデータ自体に分類が誤っているものが多数見つかった。POPFile のアーカイブ機能(受信し…
今日は疲れたので明日かな。さっき届いた稼働情報によると、連続稼働時間 362 日と 16 時間ほどらしいので、POPFile の稼働時間は 352 日あたりと思われる。残念ながら(?)稼働 1 年は達成できない模様。これを気にファームウェアのバージョンアップをしよ…
POPFile 0.22.5 がリリースされました。日本語での変更内容。→ダウンロード 今回のバージョンは細かい修正やバグフィックスを行ったマイナーバージョンアップだが、Windows 版のインストーラの改善などが行われている。 個人的に大きいと思っているのは、SSL…
今回のバージョンでは見送ったが、次のメジャーバージョンアップには実現したいと思っていること。 Kakasi がなくても動くようにする id:amatubu:20070524#p1 で書いたように、文字種による分割というシンプルな分かち書きでも高い精度が実現できることがわ…
POPFile の次のバージョン(0.22.5)のリリース候補版である、POPFile 0.22.5 RC4 が公開された(Mac OS X 版(universal binary)も公開中)。特に問題がなければ、RC5 を経て正式リリースとなる見込み。 今回のバージョンは主にバグ修正などのメンテナンス…
以前からそのうちしようしようと思っていた比較にようやく挑戦。データとテストプログラムを用意するのに手間取ってなかなかできていなかった。 昨晩 POPFile Documentation Project を久しぶりに少しメンテナンスしていたところ、xmltraintest.py というプ…
最近知ったのだけど、.Mac のメール、POP over SSL が使えるらしい。ということで、TeraStation で動いている POPFile を SSL 対応にしてみた(といっても必要なモジュールをインストールするだけなのだけど)。 OpenSSL のインストール Net::SSLeay と IO::…
パッチの修正版を公開。 パッチの内容は、 1. 分かち書きに使用するプログラムとして、Kakasi だけでなくMeCab や文字種による分割をサポート (UI の詳細設定タブの bayes_japanese_parser パラメータの値を変更することにより、分かち書きに使用するプログ…
Mac OS X 10.4.9 へアップデートしたら POPFile が動かなくなった、っていう問題が一部で起こっているようだ(本家フォーラムでの書き込み)。 あれこれ調べてみたところ、どうも MIME::Base64 perl モジュールのバージョン違いが原因らしい。このモジュール…
TeraStation 上に設置した POPFile。安定していてまったくと言っていいほど書くことがない。TeraStation 自体は uptime によると 244 日間動き続けているようだ。 POPFile はというと、/proc/PID/stat(の 22 番目の値 338971921)と /proc/uptime(の最初の…
POPFile がちゃんと動作するところまでは確認ができたので、今回は TeraStation を起動したときに自動的に POPFile が起動するようにする。ここまでできれば、POPFile サーバとしての設定が完了したと言えるだろう。 まず、プログラム(POPFile 本体)とデー…