基于贝叶斯定理的根据大学生恋爱心理数据预测性别的朴素贝叶斯模型(python+mysql)

“人工智能源于数据科学,大数据成就了人工智能”-----郭毅可

数据对人工智能来说尤为关键,我国人工智能发展如此之迅速,其中就因为我国的人口基数大.但当某些数据缺失时,怎么解决呢?

举个最简单的例子,我有一张数据表有1000条数据,里面有性别,谈恋爱次数,恋爱次数与人品,恋人的颜值,第三者出现时的做法等,但是在第100-110行中有一个字段的数据丢失了,假如缺少的是性别.那么,我是不是可以通过完整的数据去判断那10行缺的数据呢?

刚好最近在学习<<概率论与数理统计及其应用第二版>>,其中就讲到了全概率公式以及贝叶斯公式,有了一定的理论基础后,我开始尝试制作用于预测性别的贝叶斯算法模型.

我们先来学习一下基本理论, <<概率论与数理统计及其应用第二版>>这本书里的概念不容易理解,我在网上找了一些比较好理解的解释,经过总结后,跟大家分享:

先验概率
事件发生前的预判概率。可以是基于历史数据的统计,可以由背景常识得出,也可以是人的主观观点给出。一般都是单独事件概率,如P(x),P(y)

条件概率公式
设A,B是两个事件,且P(B)>0,则在事件B发生的条件下,事件A发生的条件概率(conditional probability)为:P(A|B)=P(AB)/P(B)
P(A|B)是在B发生的情况下A发生的可能性

乘法公式
由条件概率公式得:P(AB)=P(A|B)P(B)=P(B|A)P(A)
对于任何正整数n≥2,当P(A1A2…An-1) > 0 时,有:
P(A1A2…An-1An)=P(A1)P(A2|A1)P(A3|A1A2)…P(An|A1A2…An-1)

加法公式
设A和B是任意二事件,则
P(A∪B)

猜你喜欢

转载自blog.csdn.net/zbp_12138/article/details/102650552
今日推荐