ダウンロードする

POPFileの導入のためには、いろいろと必要なものがある。まず、これらをダウンロードする。ダウンロードしたファイルは、適当なフォルダを作ってまとめて入れておく。

POPFileの動作に必要なモジュールをビルドするために、開発ツールをインストールする必要がある。開発ツールはPantherのパッケージの4枚目のCD(Mac OS X Xcode Toolsと書いてある)に入っている。Running POPFile 0.2.x on Mac OS Xによれば、「Developer Tools Software」と「Mac OS X SDK」と「BSD SDK」だけインストールすればいいようだ。このあたりはディスクの残り容量と相談して選ぶことになると思う。

popfile.sourceforge.netより、クロスプラットフォーム版をダウンロードする。
加えて、0.20.0あるいは0.20.1には、日本語のメールの振り分けがうまくいかないというバグがあるため、sourceforge.jpよりパッチもあわせてダウンロードしておく。

Pantherには、バージョン2.29が含まれているので、特にダウンロードの必要はない)
CPANより、MIME-Base64モジュールをダウンロードする。パールモジュールについては、このように普通にダウンロードしてもいいし、「perl -MCPAN -e shell」でCPANのシェル(?)を呼び出し、「install MIME::Base64」としてもよい。

  • Berkeley DB

POPFile 0.20.0より、corpus(学習したデータのこと)をデータベースに保存するようになったので(0.19.1まではテキストファイルだった)、Berkeley DBというデータベースソフトをインストールする必要がある。
ダウンロードページより、Berkeley DBをダウンロードする。「b cryptography」というものの有無が選べるが、どちらでも特に問題ないらしい。うちでは、上の「WITH b cryptography」の方を選んだ。

  • BerkeleyDBパールモジュール

上でダウンロードしたBerkeley DBをPerlから使用するために必要なもの。
CPANより、BerkeleyDBモジュールをダウンロードする。

日本語は、英語と違って単語と単語の切れ目を判断するのが難しい。この切れ目の判断(分かち書き)をするために、Kakasiを利用する。
KAKASI - 漢字→かな(ローマ字)変換プログラムより、ソースコード(辞書付き)をダウンロードする。

  • Text-Kakasiパールモジュール

KakasiPerlから使用するためのモジュール。
CPANより、Text-Kakasiモジュールをダウンロードする。

  • Encodeパールモジュール

Pantherには、バージョン1.97が含まれているので、特にダウンロードの必要はない)
日本語の文字コード変換のために使用されるモジュール。
CPANより、Encodeモジュールをダウンロードする。