朴素贝叶斯(Simple Example)

1 假设

计算 P ( X | C i ) ,朴素贝叶斯分类假设类条件独立,即给定样本属性值相互条件独立。

P ( x 1 , , x k | C i ) = P ( x 1 | C i ) · · P ( x k | C i )

2 Notion

贝叶斯定理

P ( C i | X ) = P ( X | C i )     P ( C i ) P ( X ) = P ( X | C i )     P ( C i ) j = 1 c P ( X | C j )     P ( C j )

i 表示 l a b e l 的类别数

j 也表示 l a b e l 的类别数,只是为了区别于 i

先验概率 p r i o r   p r o b a b i l i t y P ( C i )

概率密度函数 p r o b a b i l i t y   d e n s i t y   f u n c t i o n : P ( X | C i )

后验概率 p o s t e r i o r i   p r o b a b i l i t i e s P ( C i | X )

总结,根据先验概率和概率密度函数,计算后验概率

eg: 对于一个二分类问题, y e s   o r   n o , 对应的贝叶斯公式如下

P ( Y e s | X ) = P ( X | Y e s ) P ( Y e s ) P ( X ) = P ( X | Y e s )     P ( Y e s ) P ( X | Y e s ) P ( Y e s ) + P ( X | N o ) P ( N o )

P ( N o | X ) = P ( X | N o ) P ( N o ) P ( X ) = P ( X | N o )     P ( N o ) P ( X | Y e s ) P ( Y e s ) + P ( X | N o ) P ( N o )

如果 P ( Y e s | X ) > P ( N o | X ) ,分类结果为 Y e s ,反之结果为 N o


3 Simple Example

这里写图片描述

X = { G e n d e r = F e m a l e , I n c o m e = H i g h , A g e = M i d d l e } 计算分类结果 Y e s   o r   N o


P ( Y e s ) = 3 / 6

这里写图片描述

由图知

P ( G e n d e r = F e m a l e Y e s ) = 2 / 3

P ( I n c o m e = H i g h Y e s ) = 3 / 3

P ( A g e = M i d d l e Y e s ) = 1 / 3

所以

P ( X Y e s ) P ( Y e s ) = P ( G e n d e r = F e m a l e Y e s ) P ( I n c o m e = H i g h Y e s ) P ( A g e = M i d d l e Y e s ) P ( Y e s ) = 2 3 × 3 3 × 1 3 × 3 6 0.111


P ( N o ) = 3 / 6

这里写图片描述

由图知

P ( G e n d e r = F e m a l e N o ) = 1 / 3

P ( I n c o m e = H i g h N o ) = 1 / 3

P ( A g e = M i d d l e N o ) = 2 / 3

所以

P ( X N o ) P ( N o ) = P ( G e n d e r = F e m a l e N o ) P ( I n c o m e = H i g h N o ) P ( A g e = M i d d l e N o ) P ( N o ) = 1 3 × 1 3 × 2 3 × 3 6 = 0.037


P ( Y e s | X ) = P ( X | Y e s )     P ( Y e s ) P ( X | Y e s ) P ( Y e s ) + P ( X | N o ) P ( N o ) = 0.111 0.111 + 0.037 = 75 %

P ( N o | X ) = P ( X | N o )     P ( N o ) P ( X | Y e s ) P ( Y e s ) + P ( X | N o ) P ( N o ) = 0.037 0.111 + 0.037 = 25 %

因为

P ( Y e s | X ) > P ( N o | X )

所以

分类结果为 Y e s

猜你喜欢

转载自blog.csdn.net/bryant_meng/article/details/80862731