统计学第二章:用图表展示数据

常用的图表:频数分布表、条形图、帕累托图、饼图、环形图、

                  直方图、茎叶图、箱图、垂线图、误差图、散点图、雷达图、轮廓图

频数分布表:分定性和定量数据两种情况

定性数据:EXCEL数据透视表、SPSS

定量数据:要先分组,一般情况下一组数据分组应在5-15组之间

                 确定组距,组距=(最大值-最小值)÷组数

在EXCEL中,数据→数据分析→直方图,但是在制作频数分布表的时候,每一组的频数包括一个组的上限值,即a<x≤b。因此要输入一列比上限值小的数作为【接受区域】

step 1:数据→数据分析(如果没有数据分析选项,可以在EXCEL选项里的加载项中添加)→直方图

step 2:在数据输入区域内选择原始数据所在的区域,接受区域选择接受区域那一列所在的区域,输出区域选择结果输出的位置;输出方式选择图表输出,确定即可。

条形图:多用于定性数据,与直方图的差别在于条形图的宽度不是组距

简单条形图、复式条形图

帕累托图:条形图和折线图的组合,需要单独列出频数、累计百分比。

饼图、环形图

直方图:多用于定量数据,能够直观地看出数据分布,但会丢失原始数据

茎叶图:既能看出数据分布,又不会丢失原始数据

箱线图:既能够反映一组数据的分布特征,是否存在离群点,还能够对多组数据的分布特征进行比较

垂线图:用于展示多个变量或多个样本取值的分布状态,将属于同一样本或类别的多个取值散点用一条垂线连接起来,用垂线的长度和垂线上的各个点来反映某个样本或类别取值的差异及其分布状况

误差图:以均值为中心,加减一定倍数标准差,展示多个样本或分类的不同取值的分布状况和离散状况

散点图:两个变量之间的关系、三个变量之间的两两关系(重叠散点图)、多个变量之间的两两关系(矩阵散点图)

雷达图、轮廓图:比较多个样本之间的相似性

猜你喜欢

转载自blog.csdn.net/moxiaoaijing/article/details/81004181
今日推荐