POPFile はどのようにしてメールを分類しているのか

How POPFile does email classification を翻訳。
ドキュメントの翻訳を進めていく中で存在を知ったのだけど、内容が気になったので訳してみた。
訳は、ドキュメントプロジェクトの用語集にある、ベイズ の下の方。
なぜそうなる、というのはあまり理解できていないけど、内部ではこんなふうに計算されているのかというのがなんとなくわかる。もう少しわかりやすく書き下す能力があれば……と思うのだけど、とりあえずは翻訳のみ。ベイズの定理を適用しているところと、それぞれの単語の確率をかけ算するところがいまいちわかっていない。勉強して内容が理解できるようになったらまた書いてみたい。ベイズ統計学入門とか読んでみようかなぁ……。素人がいきなり読んで理解できるのかどうかはわからないけど(汗)