python假设检验的实现

python假设检验的实现

#这里以熟悉的鸢尾花数据集举例
from sklearn.datasets import load_iris
data=load_iris()
df=pd.DataFrame(data['data'][:100])
df['target']=data.target[:100]
df[0].mean()

在这里插入图片描述

#z检验
import statsmodels.stats.weightstats
z,p_value=statsmodels.stats.weightstats.ztest(df[0],value=5.4)
z,p_value

在这里插入图片描述

#t检验p的数值会比大一点
import scipy.stats
t,p_value=scipy.stats.ttest_1samp(df[0],popmean=5.4)
t,p_value

在这里插入图片描述

#两样本均值的检验 t检验 ,检验均值是否存在明显差异
sample1=df[df['target']==1]
sample2=df[df['target']==0]
sample1[0].mean()
sample2[0].mean()
scipy.stats.ttest_ind(sample1[0],sample2[0])
#p值显著小于0.5,说明两类样本在0这个特征上的均值存在明显差异

在这里插入图片描述

发布了6 篇原创文章 · 获赞 0 · 访问量 56

猜你喜欢

转载自blog.csdn.net/weixin_44730016/article/details/105420726
今日推荐