概率论基础知识

离散分布:伯努力分布,二项分布,possion分布

一,伯努力分布

#执硬币
x_arr=np.array([0,1])
#x为1的概率
p=0.7
#0 1分布
#由PMF生成对应的概率  离散事件
pr_arr=stats.bernoulli.pmf(x_arr,p)
plt.plot(x_arr,pr_arr,marker='o',linestyle='None')
plt.vlines(x_arr,0,pr_arr)
plt.xlabel('Events')
plt.ylabel('Bernoulli distribution(p=0.7)')
plt.show()

二,二项分布

#二项分布  数量多时:像正态分布
n=100 #实验次数
p=0.5
x_arr=np.arange(0,n+1,1)
pr_arr=stats.binom.pmf(x_arr,n,p)
print(pr_arr)
plt.plot(x_arr,pr_arr,marker='o',linestyle='None')
plt.vlines(x_arr,0,pr_arr)
plt.xlabel('Events')
plt.ylabel('Probability')
plt.title('Bernoulli distribution(n={},p={})'.format(n,p))
plt.show()

次数到达100次就像正态分布

三,poisson分布

#poisson分布
#求某路口每小时发生k次交通事故的概率,已知每小时平均发生的次数为2
mu=2
k=10
p = 0.5
x_arr=np.arange(0,k+1,1)
pr_arr=stats.poisson.pmf(x_arr,mu)
print(pr_arr)
plt.plot(x_arr,pr_arr,marker='o',linestyle='None')
plt.vlines(x_arr,0,pr_arr)
plt.xlabel('Events')
plt.ylabel('Probability')
plt.title('Bernoulli distribution(k={},p={})'.format(k,p))
plt.show()
#

连续分布,高斯(正态分布)

四,高斯(正态分布)

mu=0#平均值
sigma=1#标准差
x_arr=np.arange(-5,5,0.1)
#概率分布函数
y_arr=stats.norm.pdf(x_arr,mu,sigma)
plt.plot(x_arr,y_arr)
plt.xlabel('x')
plt.ylabel('y')
plt.title('Gaussion distribution(mu={},sigma={})'.format(mu,sigma))
plt.show()

协方差(covariance)表达了两个随机变量的协同变化关系,即两个变量在变化过程中是同方向,还是反方向?以及其变化程度
#协防差和相关系数

相关系数(correlation)就是用X、Y的协方差除以X的标准差和Y的标准差。可看作一种剔除了两个变量量纲影响、标准化后的特殊协方差。消除了两个变量变化幅度的影响,而只是单纯反应两个变量每单位变化时的相似程度


temp_list=[14.2,16.4,11.9,15.2,18.5,22.1,19.4,25.1,23.4,18.1,22.0,19.5]
sale_list=[215,325,185,332,406,522,412,614,544,421,445,408]
plt.scatter(temp_list,sale_list)
plt.xlabel('temp')
plt.ylabel('sales')
plt.show()
# #协防差
cov_matrix=np.cov(temp_list,sale_list)
print(cov_matrix)
# #相关系数  判断数据是否线性相关度大
corr_matrix=np.corrcoef(temp_list,sale_list)
print(corr_matrix)

问题:给定一堆数据,假如我们知道它是从某一种分布中随机取出来的,可是我们并不知道这个分布具体的参数,即“模型已定,参数未知”。最大似然估计(Maximum Likelihood Estimation, MLE)目标是找出一组参数,使得模型产生出观测数据的概率最大

其中为似然函数,表示在参数theta下出现观测数据的概率为了求导方便,通常对目标取log,得到然后对theta进行求导,令导数为0,可得出最优的参数theta

复杂问题:“模型已定,参数未知”,并且参数有一个先验概率,,

贝叶斯公式:

代入MLE中,得到最大后验概率(Maximum A Posteriori, MAP),

猜你喜欢

转载自blog.csdn.net/fanzonghao/article/details/81544648