文章目录
写在前面:期刊:《微计算机信息》;中文核心期刊
作者:朱天(南昌大学),硕士研究生,江西省教育厅计划项目
1 摘要
- 【本文工作】基于模式度量的,时间序列相似性搜索
- 该方法采用分段线性表示,改进王达提出的距离模式来度量序列间的距离。
2 引言
- 时间序列是一类重要的复杂数据,蕴含着大量的规律性信息。
- 时间序列的相似性搜索,是时间序列知识发现的重要问题,其主要困难在于:相似性度量的定义和算法的时间复杂度。
【啊,这,我没有觉得序列1 和序列3 的变化趋势一样啊】
王达等人提出了 模式距离 的重要概念, 它给出了一个新颖的度量定义。能更好地反映序列间“变化趋势"的相似性。
但是它存在缺陷,由于它将模式定义为一个三元集合上升,保持,下降,不能完全地刻画出时间序列的趋势变化,并且直接使用该距离度量不能解决时间轴方向上的缩放问题。
2.1 分段线性表示
- 时间序列表示方法,很大程度上影响其距离度量对各种变形、扭曲的敏感程度,并决定相似性搜索的有效性。
- 因此,人们都在寻找鲁棒性强、能有效地应用于时间序列模式匹配的时间序列表示方法。
分段线性表示,可以将整个时间序列截成若干子序列(不一定等长),每段用直线近似表示。
这种表示方式有以下的特点:
(1)数据压缩率高,并且保留了数据的有效信息;
(2)对噪声数据的高承受能力,分段的过程也就是去除噪声的过程;
(3)数据表示更加直观简洁。