时间序列异常检测

时间序列异常检测

ID:5285944

大小:276.12 KB

页数:4页

时间:2017-12-07

时间序列异常检测_第1页
时间序列异常检测_第2页
时间序列异常检测_第3页
时间序列异常检测_第4页
资源描述:

《时间序列异常检测》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、万方数据Compu把rEngineeringandApplications计算机工程与应用2008,44(35)145时问序列异常检测周大镯L2,刘月芬2,马文秀2ZHOUDa—zhuo‘.-。LIUYue—fen2,MAWen—xiu21.天津大学管理学院,天津3000722.河北经贸大学计算机中心,石家庄0500611.SchoolofManagement,TianjinUniversity,Tianjin300072,China2.ComputerCenter,HebeiUniversityofEconomicsandTr

2、ade,Shijiazhuang050061,ChinaE-mail:zhou_zhuo@163.cornZHOUDa—zhuo.LIUYue—fen.MAWen—xiu.EffectivetimeseriesoutlierdetectionalgorithmbasedOilsegmentati6n.ComputerEngineeringand,Applications.2008。44(35):145-147.Abstract:Anewtimeseriesoutlierdetectionalgorithmofhigh—effic

3、iencyisproposedforthefoundationofk-nearestlocalout-lierdetectionalgorithmbasedonsegmentation.Firstly.seriesimportantpoint嬲segmentationpointcancompasshigh-proportional-lytimeseriesdatainthisalgorithm;Secondly,theoutlierpatternoftimeseriescanbedetectedbylocaloutlierdet

4、ectiontech-nique.Experimentalresultsonelectrocardiogram(ECG)datashowthatthealgorithmiseffectiveandreasonable.Keywords:timeseries;outlierpattern;localoutlierfactor;seriesimportantpoint摘要:在七一近邻局部异常检测算法的基础上,结合时间序列的分割方法,提出了一种高效的时间序列异常检测算法。该算法首先把序列重要点作为数据的分割点,对时间序列数据进行高比例

5、压缩;其次利用局部异常检测方法检测出时间序列中的异常模式:通过心电图(ECG)数据实验验证了算法的有效性和合理性。关键词:时间序列;异常模式;局部异常因子;序列重要点DOI:10.3778/j.issn.1002-8331.2008.35.044文章编号:1002—8331(2008)35-0145-03文献标汉码:A中图分类号:TP311.13时间序列是一类重要的数据对象,在经济、气象、医疗等领域都普遍存在,它们具有数据量大、维数高、更新速度快等特点。近年来许多学者在时I’日】序列的挖掘方面做了很多工作,相关的研究主要集中在时

6、

7、’日】序列分割、序列聚类和分类、相似查询、模式发现等研究方向。在时l’日】序列挖掘中,大部分挖掘任务的目的是为了发现那屿频繁出现的模式,期望发现某种规律,异常数据通常被作为噪声而忽略,而在另外一些领域,尽管异常数据与正常数据相比是不经常发牛的事件.但信息背后可能隐藏着一些重要信息,异常数据的发现往往能带给人们更有价值的知识。例如在金融领域,跟踪信用卡顾客的使用情况,当顾客在某段时期内的信用卡使用情况异常时,能够及时报告,预防信用欺诈。首先提出序列分段点的概念.描述了局部异常检测方法,其次利用异常检测算法计算出最异常时问序列模式

8、,最后分析了算法的性能和有效性。l相关工作目前,时

9、’日J序列的异常还没有一个公认的定义.研究也比较少,人们普遍采用的是Hawkin给出的定义I%异常是在数据集中偏离大部分数据的数据,使人怀疑这些数据是由不『一的机制产生的,而非随机偏差。从20世纪80年代起,异常检测问题在统计学领域里得到了广泛研究,随着其应用领域的不断扩展,以及其它领域方法和技术的融合,研究人员提出了许多不同的检测方法。假设检验是最早用来发现异常样本的基于统计学原理的方法i”,它基于对小概率事件的判别来实现对数据样本异常性的鉴别,丰要缺陷是事先要假定数据集符合

10、特定的分布模型,针对大量分布特征未知数据H寸,这种先验假设存在很大的局限性。近年来.基于数据挖抛的异常检测研究取得了一定的进展,Knorr等口I首先提出了基于距离的异常检测方法,从全局角度考虑通过计算数据点或对象之间的距离来检测孤立点,当数据集含有多种分布或数据

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。