时间序列的相似性查询与异常检测

时间序列的相似性查询与异常检测

ID:36541499

大小:3.76 MB

页数:107页

时间:2019-05-11

时间序列的相似性查询与异常检测_第1页
时间序列的相似性查询与异常检测_第2页
时间序列的相似性查询与异常检测_第3页
时间序列的相似性查询与异常检测_第4页
时间序列的相似性查询与异常检测_第5页
资源描述:

《时间序列的相似性查询与异常检测》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、後旦大学博士学位论文Y769591学校代码:10246时间序列的相似性查询与异常检测院系:专业:姓名:指导教师:完成日期:计算机与信息技术系计算机软件与理沦肖辉胡运发教授2005年4月15日束经作者,导师舄穗勿全文公话摘要率上超过了动态时『自J弯曲距离和欧式距离,在分类速度上比动态时间弯曲距离提高了十倍以上。(3)时间序列的索引多维空间索引常被用于时间序列的相似性查询,比如R-Tree,R+Tree,X—Tree等。但是这些索引结构是为空间对象索引而设计的,只考虑了空间对象的形状和位置,忽视了空间对象之间的顺序关系,因此并不适合时间序列的相似

2、性查询。在R.Tree的基础上,提出了一种有序的多维空间索引OR-Tree,能够保存空间对象之间的顺序关系。实验表明:与R—Tree相比,基于OR.Tree的相似性查询在磁盘I/O次数和候选集比率上都大幅度下降,相似性查询的效率得到了显著提高。该方法同样可以推广到其它的多维空间索引。(4)时间序列的相似性查询采用动态模式匹配距离的时间序列相似性查询效率仍然不高,为了进一步提高相似性查询的效率,提出了动态模式匹配距离的下界距离(简称为DPM_LB距离),只需扫描时间序列一趟。实验表明:采用DPMLB距离能够快速过滤50%以上不满足相似性要求的时

3、间序列,大大减少了动态模式匹配距离的计算量。同时,DPMLB距离满足距离收缩性引理,能够保证相似性查询的完备性。(5)时间序列的异常检测目前,时间序列的异常还没有一个大家公认的定义。论文归纳了时问序列的三种异常类型,并对时间序列的模式异常进行了深入探讨和研究。在时间序列的模式表示基础上,提出了基于模式密度的时间序列模式异常的定义。同时,给出了时间序列模式异常的检测算法,采用“异常因子”来衡量时间序列模式的异常程度。与其它异常检测算法相比,TOD算法不需要训练集,而且对算法参数的变化不敏感。在仿真数据集和真实数据集(如股票数据等)上的实验证明了

4、模式异常定义的合理性以及TOD算法的有效性。关键词:时间序列,模式表示,相似性查询,空间存取方法,异常检测中图分类号:TP39第VII页英文摘要ABSTRACTAtimeseriesisadatasequenceofobservationswhichareorderedintime(orspace),whichexistsinvariousfieldsextensively,suchasindustry,economy,finance,scienceobservingandsocialscience,etc.Howtomanageanduse

5、thesetimeseriesdataefficientlyisaninterestingproblem.Classicaltimeseriesanalysisalwaysproposeahypothesisfirst,thenproveitsvalidity,whichisnotsuitablefordiscoverytask.TimeseriesdataminingCanextracthiddenandpotentiallyusefulknowledgefromlargeamountsofdatawhichmaybeomittedbyus

6、er,whichattractsmoreandmoreanention.‘Atpresent,maintopicsoftimeseriesdatalIliIlingincludesimilaritysearch,temporalpattemmining,classificationandclusterandoutlierdetection.Inthisdissertation,similaritysearchandoutlierdetectionaretobestudied,whichincludeseveralproblemssuchasp

7、attemrepresentationoftimeseries,similaritymeasure,indexforsimilaritysearch.definitionanddetectionofoutlierintimeseries.Themainworksandcontributionsofthisdissertationare:(1)PatternRepresentationofTimeSeriesDuetolargeamountandcomplexdatacharacteroftimeseries,dataminingdirectl

8、yonrawtimeseriesistime—consumingandinefficient.Sometimes,theaccuracyandreliability

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。