时间序列数据挖掘相似性度量和周期模式挖掘的研究论文

时间序列数据挖掘相似性度量和周期模式挖掘的研究论文

ID:32350674

大小:5.75 MB

页数:153页

时间:2019-02-03

时间序列数据挖掘相似性度量和周期模式挖掘的研究论文_第1页
时间序列数据挖掘相似性度量和周期模式挖掘的研究论文_第2页
时间序列数据挖掘相似性度量和周期模式挖掘的研究论文_第3页
时间序列数据挖掘相似性度量和周期模式挖掘的研究论文_第4页
时间序列数据挖掘相似性度量和周期模式挖掘的研究论文_第5页
资源描述:

《时间序列数据挖掘相似性度量和周期模式挖掘的研究论文》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、中文摘要随着信息技术的飞速发展,数据挖掘受到越来越多的关注。时序数据在现实生活中广泛存在,如金融市场、工业过程、科学试验、医疗、气象、水文、生物信息等,而且存储规模呈现爆炸式增长。因此对时问序列数据挖掘问题进行深入研究是非常必要和富有挑战性的。目前的时间序列数据挖掘技术尚处于起步阶段,挖掘算法有待扩充和完善。本文在综述了时间序列数据挖掘研究发展概况后,对目前的主要方法进行了总结评述,在重新描述、相似性比较和周期模式挖掘几个方面进行了深入研究。最后在总结全文的基础上,指出了本文有待深入研究的若干问题。本文的创新性工作主要包括以下内容:1)提出了基于形态的时问序列相似性度量方法。本方法在时问序列

2、分段线性化的基础上,采用了基于斜率相对变化的符号化重新描述方法,可以有效描述序列形态的动态变化趋势;同时提出了一个与之对应的距离度量公式,克服了点距离度量中存在的对各种扰动敏感的缺陷。实验证明,本方法还具有时间多分辨率特征,可以比较在不同时问分辨率下的时间序列的相似程度。2)提出了局部分段动态时间扭曲算法。经典动态时间扭曲算法(DTW)在时问序列相似性度量中具有重要作用,但由于计算复杂度较高,很难应用于实际数据库中。本文提出了一个新的算法一局部分段动态时间扭曲算法。在对时间序列进行分段线性化的基础上,将每一个段视为一个整体,应用经典的动态时问扭曲算法,通过设置补偿系数,保证了算法的精度。实验

3、表明,本算法能够在计算精度几乎没有损失的情况下,有效地提高经典DTW算法的效率。3)提出了一种高效的时间序列异步周期1.模式挖掘算法。本算法设计了一种基于2进制编码的映射算法,并提出了改进的点乘算法,可以通过一次计算发现一个事件在序列中出现的所有位置;并且,本算法用并行计算替代了原算法中的串行计算方法,显著减少了数据的运算和存储次数。实验证明,本算法在完全不降低原算法准确性的基础上,显著提高了算法效率。4)首次提出了时间序列局部周期频繁模式的概念及其挖掘算法。不同于现有的所有周期挖掘算法,本算法不但能够挖掘出贯穿时间序列全局的频繁发生的周期模式,而且能够发现只在某个局部频繁发生的周期模式。本

4、算法首先将时间序列划分为局部集合,然后基于数据自行找出序列中隐藏的潜在周期,生成局部周期频繁1.模式,最后在每一个有交叉的局部上,应用最大命中子模式树算法合成复杂模式输出。实验证明,本算法可以有效地发现时间序列中的局部周期频繁模式,其中的剪切算法和周期阈值公式能够有效提高算法效率。关键词:时间序列数据挖掘重新描述相似性度量周期模式ABSTRACTDataMilliIlghasat仃actedmuchattentionwitht11edeVelopmentofinfo咖ationtectm0109y.Timeseriesda_taareakindofimportantdatae)【isting

5、iIlalotoffields,suchasfinancialm砌【et,industrialprocess,scienceeXperiments,etc,andtllequant时oftimeseries№hasexplosivelyincreas.Soitisnecessarytostudyonthesu切ectofthetimeseriesdatamining.Nowadays,timeseriesmiIlingtecllllologyisstiUinitsinf.ancyandthealgoritllInsareexpectedtobeeXtendedaIldtobecompleme

6、nted.Aftermajorissuesintimeseriesdata“ningsurveyed,somealgorith【Ilsaresulnmarizedandappraisedinthisdissertation.ThenmeprcIblemsontimeseries’representation,simil撕t)rmeasureandperiodicpattemminingarede印lyresearched.Atlast,onthebasisof也esumme巧ofthewholedissena.cion,weproposemeseVeralproblemsneededtobe

7、向ftherresearchedi11the如ture.ThemaillinnovatiVeachievementsaredescribedasf.onows.1)AnoVelmemodofsh印e-basedtimeseriessimil撕tymeasufeisproposed.BasedonthePLRalgorithm,thetimeseriesisrepresentedbyusiIlgmerelati

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。