随笔——关于贝叶斯定理

版权声明:本文为博主原创文章,未经博主允许不得转载。 https://blog.csdn.net/qian99/article/details/82823682

贝叶斯定理是一个很经典的定理,虽然公式很简单,套用起来也很方便,但是还是缺乏一个直观的sense, 似乎很有道理却说不出来,这是一件很难受的事情,今天打算好好聊一聊贝叶斯定理,看看是否可以建立一个直观的感觉。

其实,画图是一个很好理解数学公式的方法,如果各种公式都能变成一个简单的图像存在人的大脑里,那数学学起来应该会轻松很多。既有数字能够入微的计算细节,又有图像能让人把握方向,就很完美了。

所以,我们可以考虑用几何概型来描述贝叶斯定理。不过这里还是随便编一个情景,不然用A啊B啊直接描述很难有带入感。

假设你想请女神去看电影,根据过往的经验,你知道,女神10天有4天都很忧郁,女神心情好的概率是0.6,当女神心情好的时候,有很大概率答应你,设为0.8吧,如果女神心情不好,那么就只有0.1的概率答应你。你发微信通知了女神,女神答应了!这个时候你想知道女神有多大可能性心情很好(这关系到你的预算,比如要不要买好吃的取悦女神)。

好,我们现在定义两个事件:

A: 女神心情好
B: 女神答应和你看电影

我们可以用面积来表示一个事件发生的频率,这个频率与总事件的数量的比值作为概率,这也是几何概型的思想。

看下面的图:

上面的图就可以来描述这些事件,虽然面积可能不准,但是不影响整体的概念。
其中,黑框的面积是所有事件的频率,我们记做 S S ,A的面积就是A事件发生的频率(也就是女神心情好的天数),记做 S A S_A , 同理, S B S_B 就表示女神答应你去看电影的频率。再看图中紫色矩形的面积,这描述了女神心情又好又答应你看电影的频率,我们记做 S A B S_{A \cap B}

我们知道,概率可以解释为某个事件发生的频率除以事件总数:
P ( A ) = S A S P(A) = \frac{S_A}{S}
P ( B ) = S B S P(B) = \frac{S_B}{S}
P ( A B ) = S A B S P(A \cap B) = \frac{S_{A \cap B}}{S}
我们既然用面积的比值来描述,那么条件概率也是比较显然的了:
P ( A B ) = S A B S B P(A|B) = \frac{S_{A \cap B}}{S_B}
P ( B A ) = S A B S A P(B|A) = \frac{S_{A \cap B}}{S_A}

可以发现一个很有趣的事情, P ( A B ) P(A|B) 和$P(B|A) 对应发生的事件都是一个: A \cap B$,它们发生的频率也相同: S A B S_{A\cap B} ,只不过我站在不同角度看,概率就不一样了。这个事情用公式描述就是这样:
S A P ( B A ) = S B P ( A B ) = S A B S_A \cdot P(B|A) = S_B \cdot P(A|B) = S_{A \cap B}
再回到我们的目的,我们想知道在女神答应你看电影的情况下女神心情好不好(也就是 P ( A B ) P(A|B) ),我们先把上面的公式变化一下:
P ( A B ) = S A S B P ( B A ) P(A|B) = \frac{S_A}{S_B} \cdot P(B|A)
咦,这个公式是不是很熟悉了呢?其实只要再稍微变化一下,就变成了贝叶斯公式了。比较直观的解释是, S A S_A S B S_B 的比值与它们概率的比值是相同的。用上面 P ( A ) P(A) P ( B ) P(B) 的公式带入,就得到了贝叶斯公式:
P ( A B ) = P ( A ) P ( B ) P ( B A ) = P ( A ) P ( B A ) P ( B A ) P(A|B) = \frac{P(A)}{P(B)} \cdot P(B|A) = \frac{P(A) \cdot P(B|A)}{P(B|A)}

其他思考

其实上面也就是给出了贝叶斯定理的直观解释和简单推导,但是关于概率和贝叶斯,还有很多可以思考的地方。

贝叶斯公式与变化的猜测

在我看来,贝叶斯公式实际上是给出了,在你掌握了一些信息时,猜想某一个事件发生概率的计算方式,当我们完全没有任何信息时,那事件 A A 发生的概率就是 P ( A ) P(A) ,这没什么可说的,但是,如果事件 B B 发生了呢?这就相当于把黑框里面其他地方都砍掉,只剩下蓝框,这个时候 A A 发生的概率还会是 P ( A ) P(A) 吗?不会的了,到了这个时候,你再也无法把 B B 事件的影响消除,只能用新的信息来算。

举个例子,假如现在有两个人在赌钱。玩的是抛硬币,如果两个人抛硬币都是正面或反面,则第一个人赢,如果两个硬币不是同一个面,则第二个人赢。问题来了,如果第一个人抛了正面,第二个人有多少概率赢呢?

大家肯定觉得很简单,第二个人抛出正反面的概率都是0.5,所以赢的概率就是0.5。这没错,但是如果我告诉你,这第二个人是赌神高进,那么你觉得概率还是0.5吗?

哎呀,这下就不好说了,赌神赌术精湛,逢赌必赢,他老人家出马,还能输了不成?所以看起来第二个人稳赢了。
这个时候,我再告诉你,这第一个人是赌圣,这下你还会觉得赌神稳赢了吗?

赌圣虽然赌术不大行,但是有特异功能啊,又在后手,所以赌神也可能要马失前蹄了~

这是个很有意思的问题,当你对这个事情一无所知的时候,你会认为概率是这个,当掌握了一些其他信息以后,概率就会变化,因为你可能永远都不能知道世界的真相,只能根据你的所知来不断修正它。

贝叶斯公式与样本空间

从另一个角度来看,当 B B 发生的时候,实际上是“分母”发生了变化,数学上用来描述这个事情,叫做样本空间发生变化。样本空间也可以解释为所有可能发生事情的总和,当 B B 发生了,如果有某些事件就不会再发生,把这些事情从样本空间剔除掉,就是很显然的了,样本空间一变,自然 A A 发生的可能性也变了。

随机事件E的所有基本结果组成的集合为E的样本空间。

上面是从百科上找的定义,简单来说,样本空间是一个事件所有可能的结果集合。但是关于这点,我又有疑问了,人真的能找到所有可能发生的结果吗?

就拿抛硬币来说吧,正常来说,硬币不是正面就是反面,但是,也可能出现立起来的情况啊。

除了立起来,你也有可能正好撞上恐怖分子袭击,硬币被炸成渣,硬币掉到奇怪的液体里浮起来,硬币掉到岩浆里化了……听起来像是在抬杠,但是也不能说一定一定不会发生,这些结果怎么就不加到样本空间呢?

所以呢,在我看来,定义样本空间还有简化问题的意义在里面。通常在现实情况下,我们无法得到所有可能的结果,就算求的出,把这些可能性加到样本空间,又为计算添加了各种麻烦,所以干脆就不要了。样本空间定义的意义在于,只要我样本空间确定下来,那么我接下来的计算都是合情合理,也都是对的。加入发生了样本空间以外的事件,当然前面的计算推理也就全都错误了,不过好在有些事件可能几百万年也难得一见,就忽略了。

小结

好吧,先说这些吧,其实还有不少想说的,但是还没整理好思路,以后有机会在写~

猜你喜欢

转载自blog.csdn.net/qian99/article/details/82823682