基于聚类的空间数据挖掘方法与应用研究

基于聚类的空间数据挖掘方法与应用研究

ID:33091459

大小:2.13 MB

页数:71页

时间:2019-02-20

基于聚类的空间数据挖掘方法与应用研究_第1页
基于聚类的空间数据挖掘方法与应用研究_第2页
基于聚类的空间数据挖掘方法与应用研究_第3页
基于聚类的空间数据挖掘方法与应用研究_第4页
基于聚类的空间数据挖掘方法与应用研究_第5页
资源描述:

《基于聚类的空间数据挖掘方法与应用研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、山东理工大学硕士学位论文基于聚类的空间数据挖掘方法与应用研究姓名:赵国富申请学位级别:硕士专业:计算机应用技术指导教师:曲国庆20060410山东理工大学硕士学位论文摘要■●●——●■■■■—●■■●——■——■■■■

2、■●■——■■■■●●■■■——■■—■■■■●———●—————●-II_镑要随着空间数据获取技术的快速发展,空间数据量急剧增加,空间数据库中很多内涵的知识和规律需要挖掘。聚类分析是知识发现的一个重要方法,要求聚类算法效率高、需要的参数能自动确定或用户易确定。为此,本文主要围绕如下3个方面展开研究。1.分层聚类方法与应用通过多次尝试、比较,对五种距离的分层聚类算法进行了性能

3、总结;提出按照离差分析方法的思想,进一步验证聚类结果的正确性,大大提高了算法结果的有用性;改进的分层聚类方法对数据提前进行了预聚类,运算速度大大提高,能同时对离散和连续变量进行聚类,能自动选取聚类的数量,对海量的数据进行分析处理。2.k—means聚类方法与应用提出了利用最优化尺度变换方法,对分类数据变量进行离散化处理,所有的变量统一处理:提出了利用多次随机取样的算法,并在样本上利用分层聚类方法判别最佳聚类的类别数量,并充分考虑数据的内涵及其分布特点,使选取的初始聚类中心更有代表性;在此基础上,提出了改进的k—means算法。由算法分析和实验结果可知,对k—means算法的改进在理论上是合理

4、的,在实践上是可行的,在一定程度上提高了聚类结果的稳定性,减小聚类结果对初值的依赖。3.基于聚类的空间数据挖掘系统设计提出了一个基于聚类的空间数据挖掘系统的框架,从系统设计目标、系统设计和系统实现3个部分展开研究,采用模块化设计的思想,将系统设计划分为数据访问、聚类、用户交互和知识库管理4个模块;通过系统的实现,把本文研究的聚类方法集成在一起,为基于聚类的空间数据挖掘方法与应用提供技术支撑。总之,研究基于聚类的空间数据挖掘技术,一方面可使GIS查询和分析技术提高到发现知识的新阶段,另一方砸从中发现的知识可构成知识库用于建立智能化的GIS系统,为决策者提供有价值的知识,带来不可估量的效益。因此

5、基于聚类的空间数据挖掘方法与应用研究具有重要的理论意义和实用价值。关键诃:聚类,空间数据挖掘.分层聚类算法,k—means算法,挖掘系统山东理工大学硕士学位论文Abstmct■■■—-II_—-—■●■—●__-AbstractWiththefastdevelopmentofspatialdataobtainedtechnology,spatialdataincrease“prapidly.Thereareagreatmanyintensiveknowledgeandlawtoexcavateinthespatialdatadatabases.ClusteranalysisisCUeofim

6、portantmeans,whichrequiresalgorithmwithhighefficientandautoascertainorusereasyascertainthedemandedparameters.Therefore,ourstudymostlysurrounds3aspectsasfollows.1.ThehierarchicalclusteralgorithmandapplicationFivespaceregularclusteringalgorithm’sperformancesummarizationwasattainedthroughmanytimesofat

7、tempt,compare;Amethodoftheresultvaliditythroughdispersionanalysisideawasintroduced,itmakestheresultmoreavailable;AmethodofproceedingdatainadvanceWaSintroduce,itacquitsmorequicklyoperationalspeed,anditisabletododiscreteandcontinuousvariable,toauto-selectthequantityofclustering,toproceedmagnanimityda

8、ta.2.Thek—meansclusteralgorithmandapplicationAmethodofproceedingallvariablewasintroducedbyoptimizingscaletransform:Arandomsamplingalgorithmwasintroduced.wemadeuseofHCAtoacquirethebestcategoricalnumber,consi

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。