欢迎来到天天文库
浏览记录
ID:36359460
大小:3.08 MB
页数:104页
时间:2019-05-10
《时间序列挖掘相关算法研究及应用》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、中国科学技术大学博士学位论文时间序列挖掘相关算法研究及应用姓名:杜奕申请学位级别:博士专业:计算机应用技术指导教师:卢德唐20070501时问序列挖掘相关算法研究及应用用于时态频繁模式的挖掘。改进后的算法构造了一种用于存储频繁模式时态属性的双树结构。利用这种双树结构,两次扫描数据库实现时态频繁项目的有效挖掘。实验结果表明该算法是有效的和可扩展的。5.针对目前石油工业领域中各类数据序列的特点和实际的应用需求,给出时间序列挖掘算法在测井和录井数据序列中的应用样例。实验结果显示:①数据序列在线划分算法实现了测井曲线的快速粗划分和
2、分段信息的快速查询;②数据序列线性分段拟合方法能够有效捕获色谱和测井数据序列中的尖峰予序列,准确定位序列中的变化转折点,忽略变化细微的数据点,在保持序列形态不变的同时极大地降低了数据存储量。全文共分为七个章节,第一章对时间序列挖掘进行了综述,包括其应用背景、国内外研究进展等;第二章至第五章从四个方面展开了算法研究探讨:时间序列的线性拟合、时间序列的在线划分、时间序列的相似性度量和时态频繁模式挖掘;第六章在上述研究的基础上,给出了序列挖掘算法在石油测井和录井数据序列中的应用实例;最后一部分,即第七章,对全文进行总结,并提出了
3、进一步的研究思路。。关键词:时间序列,线性拟合,关键点,在线划分,划分特征链表,相似性查询,时态频繁模式ABSTRACTWitllthepopularityofcomputerandinformationtechnology,andthegreatdevelopmentofstoragetechniqueofhighcapacity,agreatamountofdataisaccumulatedindailyworkandinscientificresearch.Muchpotentiallyusefulknowledge
4、isbidedbehinddata.Todayhowtomanageandusethesetimeseriesdataefficientlyandextractusefulinformationisanimportantproblemindatamining.Timeseriesdatareflectsthefeaturesofattributevaluesalongtimesequenceorspatialsequence.Bymimngpatternsfromtimeseriesdata,wecangetusefuli
5、nformationrelatedtotimehiddeninthedatabase,thusimplementextractionofknowledge.Timeseriesarecomplextypesofdata.Theyoftenhavehighdimensionality,noiseandvariousdistortionsetc.TimeSeriesDataMining(TSDM)isoneofthemostimportantresearchfieldsofDatamining。Itstopicsinclude
6、timeseriesrepresentation,similaritysearch,clustering,classification.outlierdeteetionandSOon.Basedontheactualapplicationofanalyzingwellloggingandmudloggingtimeseriesinoilfield,thispaperdiscussesthecurrentresearchsituation,relatedwork,andsomeup-to—datetechnologiesan
7、ddevelopments.Inallusiontotheproblemsofcurrentapproaches,westudytimeseriesdatamininginfouraspects:linearfitting,onlinesegmentation,similaritysearchandtemporalfrequentpatternsdiscovery.Somerelatedalgorithmsandsolutionsarepresentedhere.Themainworksandcontributionsof
8、thisdissertationare:1.Anovellinearfittingalgorithmbasedonkeypointsispresented.Theapproachfirstchoosesthreecontinuousdatapointsinturnwhenthedatapointsint
此文档下载收益归作者所有