贝叶斯定理简介

1.贝叶斯定理有什么用:
为了解决“逆概率”问题,它可以根据过去的数据来预测出概率,在有限的信息下,能够预测出概率。
2.什么是贝叶斯定理:
公式: P(A|B) = P(A) * [P(B|A)/P(B)]
1)P(A):先验概率,即在不知道B事件的前提下,我们对A事件概率的一个主观判断。
2)P(B|A)/P(B):可能性函数,这是一个调整因子,即新信息B带来的调整,作用是使得先验概率更接近真实概率。
  2.1.如果“可能性函数”P(B|A)/P(B) > 1,意味着“先验概率”被增强,事件A的发生的可能性变大;
  2.2.如果“可能性函数”= 1,意味着B事件无助于判断事件A的可能性;
  2.3.如果“可能性函数”< 1,意味着“先验概率”被削弱,事件A的可能性变小;
3)P(A|B):后验概率,即在B事件发生以后,我们对A事件概率的重新评估。
3.应用案例:
1)全概率公式:这个公式的作用是计算贝叶斯定理中的P(B)
   P(B) = P(B|A)P(A) + P(B|A')P(A')
含义:如果A和A'构成一个问题的全部(全部的样本空间),那么事件B的概率,就等于A和A'的概率分别乘以B对这两个事件的条件概率之和。
案例题:1号碗(30颗巧克力+10颗水果糖)、2号碗(20颗巧克力+20颗水果糖)
问:把碗盖住,随机选择一个碗,从里面摸出一颗巧克力,这颗巧克力来自1号碗的概率有多少?
解:来着1号碗记为事件A1,来着2号碗记为事件A2,那么问题即为P(A|B)【即取出的是巧克力,来着1号碗的概率】
1)求先验概率:
由于两个碗是一样的,所以在得到新信息(取出的是巧克力之前),这两个碗被选择的概率相同。因此P(A1) = P(A2) = 0.5(A1表示来着1号碗,A2表示来着2号碗)
2)求可能性函数 P(B|A)/P(B):
P(B|A1)表示从1号碗中(A1)取出巧克力(B)的概率
因为1号碗里有30颗巧克力+10颗糖,所以P(B|A1) = 30/(30+10) = 75%
P(B) = P(B|A1)P(A1) + P(B|A2)P(A2) = [30/(30+10)]*0.5 + [20/(20+20)]*0.5 = 62.5%
可能性函数P(B|A1)/P(B) = 75%/62.5% = 1.2
3)带入贝叶斯公式求后验概率:
P(A1|B) = P(A1)*[P(B|A1)/P(B)] = 50%*1.2 =60%

2)如果将公式中的A换成“规律”,B换成“现象”:
   P(规律|现象) = P(现象|规律)[P(规律)/P(现象)]
还以前案例分析:这儿有两个规律(从1号碗来规律、从2号碗来规律),有两个现象(巧克力现象、水果糖现象)。而且知道两个碗是一模一样的,所以两个规律的概率是一样的,P(从1号碗来规律) = P(从2号碗来规律) = 0.5。同时知道P(巧克力现象|从1号碗来规律) = 30/(30+10)=0.75,P(水果糖现象|从1号碗来规律)=10/(30+10)=0.25;P(巧克力现象|从2号碗来规律) = 20/(20+20)=0.5 = P(水果糖现象|从2号碗来规律)。另外,P(巧克力现象)=(30+20)/(30+10+20+20)=0.625,P(水果糖现象)=(10+20)/(30+10+20+20)=0.375。现在的问题是观察到了一个巧克力现象,要求推断后面的规律,即从1号碗来的规律的概率有多大,也就是P(从1号碗来规律|巧克力现象):
P(从1号碗来规律|巧克力现象) = P(巧克力现象|从1号碗来规律)*[P(从1号碗来规律)/P(巧克力现象)] = 0.75*[0.5/0.625]=60%

举例2:
1所学校里有60%的男生,40%的女生。男生总是穿长裤,女生则一半穿长裤、一半穿裙子。假设你走在校园里,迎面走来一个穿长裤的学生,问男生的概率是多大?
这儿有两个规律(是男生规律、是女生规律),而且知道规律的发生概率P(是男生规律)=0.6,P(是女生规律)=0.4。有两种现象(穿长裤现象、穿裙子现象),假设有10个学生,6个男生、4个女生,那么P(穿长裤现象)=(6+2)/10=0.8,P(穿裙子现象)=2/10=0.2。另外,P(穿长裤现象|是男生规律)=6/6=1,P(穿裙子现象|是男生规律)=0,P(穿长裤现象|是女生规律) = P(穿裙子现象|是女生规律)=0.5。现在,看到了一个穿长裤的学生,需要推断是男生的概率,即P(是男生规律|穿长裤现象):
P(是男生规律|穿长裤现象) = P(穿长裤现象|是男生规律)*[P(是男生规律)/P(穿长裤现象)]=1*[0.6/0.8]=0.75

举例3:
一辆出租车在雨夜肇事,现场有一个目击者说,看见该车是蓝色。已知:1.该目击者识别蓝色和绿色出租车的准确率是80%;2.该地的出租车85%是绿色的,15%是蓝色的。问:那辆肇事车是蓝色的概率有多大?
有两个规律:蓝色的车、绿色的车,有两个现象(或者叫观察、数据、采样等等):车被看成蓝色、车被看成绿色。从例子中的信息可知:P(绿色的车)=0.85,P(蓝色的车)=0.15。P(车被看成蓝色|蓝色的车)=0.8,P(车被看成绿色|蓝色的车)=0.2,P(车被看成绿色|绿色的车)=0.8,P(车被看成蓝色|绿色的车)=0.2。假设该地有100辆出租车,那么,85辆是绿色的、15辆是蓝色的。再者,目击者只有80%的准确率,那么,车被看成蓝色的有:是蓝色的看成了蓝色的=15*0.8=12,是绿色的看成了蓝色的=85*0.2=17,总计12+17=29,所以P(车被看成蓝色)=29/100=0.29
P(蓝色的车|车被看成蓝色) = P(车被看成蓝色|蓝色的车)*[P(蓝色的车)/P(车被看成蓝色)] = 0.8*[0.15/0.29]=0.4138

猜你喜欢

转载自blog.csdn.net/zhaocen_1230/article/details/79733726