close
分享使用bayes theorem 為基礎的分類系統,需要training 。
首先要先有很多的資料,這裡使用的是資料是文章及文章分類。
let Pr(A) = 分類A出現的比例。
let Pr(B) = 文章B在全部文章出現的比例。
我們可以算出 Pr( B | A ) ,因為每篇文章已經知道其分類了。
給一篇新的文章,若想要知道其可能是哪個分類,算 Pr( A | B ),
利用 Pr (A | B ) = Pr( B | A ) *Pr(A)/Pr(B)。
Pr(B) 可以當成一個定值。
因為我們想要求解是
for ( int i = 0 ;i < Len(分類) ; i++)
m = max(m , Pr( 分類[i] / article))
缺點是我們假設 A , B 是 independent 的。
全站熱搜
留言列表