MATLAB数据探索

版权声明: https://blog.csdn.net/qq_41912125/article/details/80946804

数据探索:
异常值分析:简单统计原则,比如年龄199岁的。
3@原则:如果数据服从正态分布,异常值被定义为一组测定值中与平均值的偏差超过三杯标准差的 值。在正态分布的假设下,距离平均值3@之外的值出现的概率为p(|x-u|>3@)<=0.003,其 属于极个别的小概率事件。如果数据不服从正态分布,也可以用远离平均值的多少倍的标 准差来描述。
箱型图分析:求出下界,下四分位,中位数,上四分位,上界,离群点。
代码实现:先略,2018/7/8号晚补出来
统计量分析:
均值:mean_=mean(num);
中位数:median_=median(num)
众数:mode_=mode(num)
极差:range_=range(num)
标准差:std_=std(num)
变异系数:variation_=std_/mean_;
四分位数间距:q1=prctile(sales,25);
      q2=prctile(sales,75);
      distance=q3-q1;
周期性分析:
贡献度分析:
相关性分析:下次继续写。。。。有点忙。。

猜你喜欢

转载自blog.csdn.net/qq_41912125/article/details/80946804