ベイズ理論

誰も詳しいことは分かっていないらしい。
数理統計学における自己学習型予測推論モデル。
p(A|B) = [ p(B|A) p(A) ] / p(B)
「Bが起こった原因がAである確率」を求める理論。
http://ja.wikipedia.org/wiki/%E3%83%99%E3%82%A4%E3%82%BA%E3%81%AE%E5%AE%9A%E7%90%86
http://japan.cnet.com/special/story/0,2000050158,20052855,00.htm
http://www.itmedia.co.jp/enterprise/articles/0502/07/news069.html
http://yudkowsky.net/bayes/bayes.html
http://hotwired.goo.ne.jp/news/technology/story/20010423302.html
http://okdt.org/blog/2004/09/popfile.html
GoogleインテルMicrosoftが注目してるとの報道があったのは2002年ごろのようだが、うちのパッケージはUS本社が1998年くらいに独自拡張して特許をとったそうな。
ここに書いてあることを読むと、加重平均とさして違いがないような気がするんだけど、どうなんだろ。


最近はスパムフィルタなんかにも使われているらしい。たぶんHotmailは絶対使ってる。
ルールベース、ホワイト/ブラックリスト設定、ベイジアンフィルタの3つってのは基本となる組み合わせだろうな。


この記事に「過去と未来が著しく変化する領域」「重要な意思決定に関わる領域」には向かないと書かれているが、半分当たって半分ずれてると思う。
「過去と未来が著しく変化する領域に向かない」というのは恐らく確かで、過去の確率から未来予測を立てるのであるから、未来に起こる事象についての過去の標本数が少なければ確度の高い予測数値は得られないと思う。
ただし、「重要な意思決定にかかわる領域」に向かないというのはちと論点がずれてると思う。ベイズ理論は数字を出すだけであって、意思決定自体は人間が行う。(または数字による順番に基づいてどれを採用するかは人間が決めたルールに従って決定される。)ベイズ自体の可能性として向かないということとは異なるだろう。