欢迎来到天天文库
浏览记录
ID:23190645
大小:682.33 KB
页数:27页
时间:2018-11-04
《数据挖掘中聚类算法的应用设计》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库。
1、吉林电子信息职业技术学院毕业论文(设计)题目:数据挖掘中聚类算法的应用设计系部:机电技术学院专业班级:12级机电17班指导教师:高岩姓名:王增亮摘要聚类分析是数据挖掘屮的一个主要研究方向,目前己经深入到各个领域并取得了很好的进步。本文将从数据挖掘入手,详细探讨聚类算法在数据挖掘的发展过程中所起的作用,并对聚类算法在各个时期的理论和应用作相应分析。最后,我们将对聚类的K-Means算法进行实例操作,分析聚类算法存在的问题和一些解决方案。希望能总结对过去成果并对今后发展方向起到引导作用。关键词:信息;数据挖掘;聚类分析;K-Means算法AbstractTheanalyseofclu
2、steringisamajorpartinthedatamining,whichhavealreadybeenappliedintoseveraldomainsandearnedalargeadvancement.Inthepaper,wewillgiveadetaileddiscusswiththefunctionofclusteringalgorithmactedonthedevelopingofdatamining,startingwiththeintroductionofdatamining,andgiveaanalysisonthetheoreticsandappici
3、ationoftheclusteralgorithmindifferentphases.Atlast,wewillvalidatetheK-Meansalgorihmofciusering,analysetheproblemexistedinthealgorithmandgivesomemethodstoreslovethemthroughagivenexample.Thesemaybesummarizetheachievementandchanneloffthedevelopingofdatamining.KeyWords:Information;DataMining;TheA
4、nalyseofClustering;TheK-Meansa1gorithm目录«IAbstractIIa录hi弓Iwi第1章聚类分析基本概念与算法21.1聚类分析21.2常见数据类型和距离公式21.3聚类的一般步骤41.4划分聚类41.5层次聚类5第2章新发展的聚类算法72.1基于模糊的聚类方法72.2量子聚类82.3核聚类82.4谱聚类9第3章程序调试103.1原理描述103.2数据的引入和处理113.3实验操作过程13结束语20参考文献21in引言当我们步入二十一世纪时,信息产业在全世界范围内以信息的几何堉长的速率快速发展起来。对各个领域和企业部门来说,增强对数据中信息价值
5、的利用可以引导其在激烈的竞争环境屮快速发展并力求胜出。在推行电子政务的今天,政府部门的数据也在进行数字化。科研机构更是收集Y人量的科学研宂数据,试图从屮发现自然界和社会及经济运转的秘密。这些都是我们解读数字信息所需面临的一些新的挑战。比如,根据对客户销售关系的研究,我们可以知道,一个好的行为描述经常也是对行为本身的一种解释,至少提示从哪里寻找解释。这种解释通常來白我们对业务范围内的相关销售份额及客户和市场信息,所以要求我们通过不同模式进行“创意”分析,寻找利润的最大支撑点。信息是由数据所表达的客观事实,而知识是信息经过贺能性加工过后的产物。0前虽然能实现高效的数据录入、查询、统计
6、、输出和积累等功能,但是却随之出现一个问题,人量的数据相对降低了人们分析数据的能力,使发现人数据集屮数据间关联规则更加困难,从而对根据数据预测趋势的能力得不到保障。出现了“数据丰富而信总贫乏”的现象。数据挖掘的0的就是帮助决策者寻找数据间潜在的知识,对决策者在现有的信息基础上预测未来的发展趋势并作出决策是非常有用的。一直以来,人们认识事物时往往先把被认识的对象进行分类,以便寻找其屮同与不同的特征。在医学实践中经常需要做分类的工作,如根据病人的一系列症状、体征和生化检查的结果,判断病人所患疾病的类型。又如,当对屮国古代的政治和经济状况进行解读时,以前只能通过史书屮的片言记载,不能得
7、到强有力的推断。而现在可以从数据挖掘的角度,利用各个学科相结合的技术和优势,对生物、天文、地理、人物传记、风俗人情等一系列大量的信息进行数据处理、挖掘和推测,从而可望发掘出新的结果。为此,数据挖掘的算法研究一直是我们所关注的重点,它具冇巨人的潜在利润空间,这也是本文进行数据挖掘中聚类算法研究的0的和意义所在。第1章聚类分析基本概念与算法1.1聚类分析聚类分析(ClusterAnalysis)是根据事物本身的特性研究个体的一种方法,目的在于将相似的事物归类[1]。它的原则是同一类屮
此文档下载收益归作者所有