一、概率论与统计学
概率论是统计学的基础,统计学冲锋在应用第一线,概率论提供武器。
古典概率论
戈尔莫格洛夫创建现代概率论
二、统计学
描述统计学
推断统计学
三、集中趋势
均值:算数平均数,描述平均水平。
中位数:将数据按大小排列后位于正中间的数描述,描述中间水平。
众数:数据中出现最多的数,描述一般水平。
四、离散程度的描述
极差:最大值-最小值,简单地描述数据的范围大小。
方差:数据离中心越远越离散。
标准差:方差的开平方。
五、直方图
频数分布表
频数直方图
频率直方图:与频数直方图相比,纵坐标采用了频率、组距。
频率=频数/总数,组距就是分组的极差。
六、箱线图
下四分位数:Q1,将所有数据按照从小到大的顺序排序排在第25%位置的数字。
上四分位数:Q3,将所有数据按照从小到大的顺序排序排在第75%位置的数字。
四分位距:IQR,等于Q3-Q1,衡量数据离散程度的一个统计量。
异常点:小于Q1-1.5IQR或大于Q3+1.5IQR的值。
上边缘:除异常点意外的数据中的最大值。
下边缘:除异常点以外的数据中的最小值。
七、茎叶图
茎叶图可以在保留全部数据信息的情况下,直观地显示出数据的分布情况。
八、线图
以时间为横坐标,变量为纵坐标,反映变量随时间推移的变化趋势。
九、柱形图
显示一段时间内的数据变化或显示各项之间的比较情况。
十、饼图
饼图(饼状图),根据各项所占百分比决定在饼图中的扇形面积,简单易懂,通俗明了,可以更加形象地看出各个项目所占的比例大小。