用R语言做数据分析——对用电负荷时间序列数据进行K-medoids聚类建模和GAM回归



通过对用电负荷用r软件进行聚类,我们可以提取典型负荷曲线,提高随后的用电量预测的准确性。


我将向您展示第一个用例,即通过K-medoids聚类方法提取典型的电力负载曲线。


我们必须以某种方式降低维度。最好的方法之一是使用时间序列表示来降低维度,减少噪音并强调时间序列的主要特征。


我们使用一种基本的基于模型的表示方法 - 平均季节性轮廓。另一个非常重要的通知是,时间序列的归一化是时间序列的每个聚类或分类之前的必要过程。


使用K-medoids(pam函数从cluster包)聚类方法 。



“最佳”数量的簇是7 。

我们用7个聚类数绘制聚类结果。 



现在,让我们尝试一些更复杂的方法来提取季节性分布 - GAM回归系数

可视化结果:




再次聚类的最佳数量是7.让我们绘制结果。



 提取的消费情况比平均季节性情况更平滑。蓝色虚线与每日和每周季节性系数相接。

 我将向您展示一些非数据自适应表示的聚类结果,让我们选择例如DFT(离散傅立叶变换)方法并提取前48个DFT系数。





 因此,基于模型的时间序列表示在这种用例中非常有效(因此典型的剖面提取)。

FeaClip是从限幅表示特征提取方法。建议将FeaClip旁边的开窗方法用于时间序列的每一天。 

我们绘制结果



我们可以看到,现在出现了2个“肘部”。最大的变化是在2到3个簇之间,所以我会选择3号。




结论

在本教程中,我向您展示了使用时间序列表示方法来创建更多消费者的特征。





大数据部落 ——中国专业的第三方数据服务提供商,提供定制化的一站式数据挖掘和统计分析咨询服务
统计分析和数据挖掘咨询服务 : y0.cn/teradat (咨询服务请联系 官网客服
点击这里给我发消息 QQ:3025393450

【服务场景】        
 
             
科研项目;
        
             
公司项目外包 ;线上线下一对一培训 ;学术研究。
【大数据部落】提供定制化的一站式数据挖掘和统计分析咨询服务
 
分享最新的大数据资讯,每天学习一点数据分析,让我们一起做有态度的数据人 【大数据部落】大数据部落提供定制化的一站式数据挖掘和统计分析咨询服务
微信客服号:lico_9e
QQ交流群:186388004  
欢迎关注微信公众号,了解更多数据干货资讯!

 

通过对用电负荷用r软件进行聚类,我们可以提取典型负荷曲线,提高随后的用电量预测的准确性。


我将向您展示第一个用例,即通过K-medoids聚类方法提取典型的电力负载曲线。


我们必须以某种方式降低维度。最好的方法之一是使用时间序列表示来降低维度,减少噪音并强调时间序列的主要特征。


我们使用一种基本的基于模型的表示方法 - 平均季节性轮廓。另一个非常重要的通知是,时间序列的归一化是时间序列的每个聚类或分类之前的必要过程。


使用K-medoids(pam函数从cluster包)聚类方法 。



“最佳”数量的簇是7 。

我们用7个聚类数绘制聚类结果。 



现在,让我们尝试一些更复杂的方法来提取季节性分布 - GAM回归系数

可视化结果:




再次聚类的最佳数量是7.让我们绘制结果。



 提取的消费情况比平均季节性情况更平滑。蓝色虚线与每日和每周季节性系数相接。

 我将向您展示一些非数据自适应表示的聚类结果,让我们选择例如DFT(离散傅立叶变换)方法并提取前48个DFT系数。





 因此,基于模型的时间序列表示在这种用例中非常有效(因此典型的剖面提取)。

FeaClip是从限幅表示特征提取方法。建议将FeaClip旁边的开窗方法用于时间序列的每一天。 

我们绘制结果



我们可以看到,现在出现了2个“肘部”。最大的变化是在2到3个簇之间,所以我会选择3号。




结论

在本教程中,我向您展示了使用时间序列表示方法来创建更多消费者的特征。


猜你喜欢

转载自blog.csdn.net/qq_19600291/article/details/79669231
今日推荐