欢迎来到天天文库
浏览记录
ID:36559157
大小:3.36 MB
页数:66页
时间:2019-05-12
《时间序列异常检测的聚类方法研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、分类号TP391重庆邮电大学硕士学位论文论文题目吐!里壁到是堂捡塑』鲍墨差壅鎏塑窒DetectionofTimeSeries硕士研究生堑差鲨指导教师堂左生割耋咝学科专业盐差垫廛旦垫查论文提交日期2Q12生垒且论文答辩日期至Q!垄生量旦论文评阅人答辩委员会主席王越教授2012年5月独创性声明本人声明所呈交的学位论文是本人在导师指导下进行的研究工作及取得的研究成果。据我所知,除了文中特别加以标注和致谢的地方外,论文中不包含其他人已经发表或撰写过的研究成果,也不包含为获得重麽自E电太堂或其他教育机构的学位或证书而使用过的材料。与我一同工作的同志对本研究所做的任何贡献均已在论文中作了
2、明确的说明并表示谢意。学位论文作者签名:物羹名签字日期.缈年多月岁日学位论文版权使用授权书本学位论文作者完全了解重废自&电太堂有关保留、使用学位论文的规定,有权保留并向国家有关部门或机构送交论文的复印件和磁盘,允许论文被查阅和借阅。本人授权重庆由&电态堂可以将学位论文的全部或部分内容编入有关数据库进行检索,可以采用影印、缩印或扫描等复制手段保存、汇编学位论文。(保密的学位论文在解密后适用本授权书)学位论文作者虢栖耄碧签字日期刀冱年∥月岁日新虢浓灼笠签字日期:知【≯年厂月莎日摘要随着时间的推移,数据呈爆炸式的增长,要想从这些复杂、海量的数据中发现潜在有用的信息,是一件极为困难的
3、任务,同时也给时间序列数据挖掘带来了巨大的挑战。数据集中的某些数据,它们与大多数数据的一般行为或模型不一致,这些数据被称作异常数据。绝大多数的数据挖掘算法通常把异常数据视为噪声而丢弃,然而在一些实际应用中,异常数据更具有研究价值。因此,对时间序列的异常进行深入地研究具有重要的意义。首先,研究了时间序列的滑动窗口方法、自顶向下方法和由底向上方法,给出了基于重要点的时间序列分段算法,通过重要点将时间序列分成多个互不重叠的子序列,并提取每个子序列的特征值,为聚类算法进行异常子序列的检测做了准备。该算法在有效地压缩了时间序列数据的同时保留了原有时间序列的主要特征,并且具有较低的时间复
4、杂度。其次,研究了围绕中心点的划分算法PAM聚类算法、基于PDS、TIE和PMI的快速PAM聚类算法和基于k中心点的迭代局部搜索聚类算法,通过对初始簇的对象个数的限定和初始簇的平均距离的求解来确定初始的中心点,从而给出了一种基于初始聚类中心点选取的改进的PAM(IPAM)聚类算法,然后通过对划分后簇的平均距离进行阈值的设定来检测异常子序列,并着重对该算法的异常检测质量和时间效率进行分析,实验证明该算法具有与局部异常检测算法类似的检测效果,较低的时间复杂度,并且具有优于PAM算法的检测效果和时间复杂度。最后,将改进的PAM(IPAM)算法运用到程序设计自主教学与学习平台中,挖掘
5、学生的成长效果。挖掘的结果有助于掌握学生的学习情况,从而能够更好的开展教学活动。关键词:时间序列,异常检测,重要点,异常子序列,改进的PAM算法AbstractAstimegoeson,datagrowsexplosively.Itisadifficulttasktofindpotentialusefulinformationandknowledgefromthecomplexandlargedatasets,atthesametimeitbringsgreatchallengestothetimeseriesdatamining.SomedataindatasetsiSde
6、viatedfromtheactionsorthemodelofthemostdata.Thedataisconsideredasoutliers.Mostdataminingmethodsusuallydiscardtheoutliersasnoisesorabnormalpoints.Howeverinsomepracticalapplications,theoutliershavemanyresearchvalues.Therefore,deepanalysisofthetimeseriesoutliershasimportantsignificances.Firstl
7、y,thispaperresearchestheslidingwindowalgorithm,top—downalgorithmandbottom—upalgorithmofthetimeseries,andproposesthetimeseriessegmentationmethodbasedonimportantpoints.AccordingtothemthetimeseriesissegmentedintomanynonoVerlappingsubsequenes,andextractsthec
此文档下载收益归作者所有