close

分享使用bayes theorem 為基礎的分類系統,需要training 。

 

首先要先有很多的資料,這裡使用的是資料是文章及文章分類。

 

let Pr(A) = 分類A出現的比例。

let Pr(B) =  文章B在全部文章出現的比例。

 

我們可以算出 Pr( B | A ) ,因為每篇文章已經知道其分類了。

 

給一篇新的文章,若想要知道其可能是哪個分類,算 Pr( A | B ),

 

利用 Pr (A | B ) = Pr( B | A ) *Pr(A)/Pr(B)。

 

Pr(B) 可以當成一個定值。

 

因為我們想要求解是

for ( int i = 0 ;i < Len(分類) ; i++)

  m = max(m , Pr( 分類[i] / article))

 

缺點是我們假設 A , B 是 independent 的。

arrow
arrow
    全站熱搜
    創作者介紹
    創作者 lettice0913 的頭像
    lettice0913

    斑的家

    lettice0913 發表在 痞客邦 留言(0) 人氣()