蚁群文本聚类算法的研究与应用

蚁群文本聚类算法的研究与应用

ID:37499239

大小:2.21 MB

页数:68页

时间:2019-05-24

蚁群文本聚类算法的研究与应用_第1页
蚁群文本聚类算法的研究与应用_第2页
蚁群文本聚类算法的研究与应用_第3页
蚁群文本聚类算法的研究与应用_第4页
蚁群文本聚类算法的研究与应用_第5页
资源描述:

《蚁群文本聚类算法的研究与应用》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、代号10701学号1077490400分类号TP311密级公开UDC编号题(中、英文)目蚁群文本聚类算法的研究与应用ResearchandApplicationofAntColonyTextClusteringAlgorithm作者姓名郑方学校指导教师姓名职称刘志镜·教授工程领域计算机技术企业指导教师姓名职称苏健·总经理·论文类型应用基础技术提交论文日期二○一三年一月·西安电子科技大学学位论文独创性声明秉承学校严谨的学风和优良的科学道德,本人声明所呈交的论文是我个人在导师指导下进行的研究工作及取得的研究成果。尽我所知,除了文中特别加以标注和致谢中所罗列的内容以外,论文中不包含其他人已经

2、发表或撰写过的研究成果;也不包含为获得西安电子科技大学或其它教育机构的学位或证书而使用过的材料。与我一同工作的同志对本研究所做的任何贡献均已在论文中做了明确的说明并表示了谢意。申请学位论文与资料若有不实之处,本人承担一切法律责任。本人签名:日期:西安电子科技大学关于论文使用授权的说明本人完全了解西安电子科技大学有关保留和使用学位论文的规定,即:研究生在校攻读学位期间论文工作的知识产权单位属西安电子科技大学。学校有权保留送交论文的复印件,允许查阅和借阅论文;学校可以公布论文的全部或部分内容,可以允许采用影印、缩印或其它复制手段保存论文。同时本人保证,毕业后结合学位论文研究课题再撰写的文章

3、一律署名单位为西安电子科技大学。(保密的论文在解密后遵守此规定)本学位论文属于保密,在年解密后适用本授权书。本人签名:导师签名:日期:日期:摘要摘要随着信息技术的飞速发展以及信息获取的便利,人们已经被大量的信息淹没。如何从信息的海洋中提取出人们感兴趣的知识,完成特定的任务成为一个迫切需要解决的问题。基于这样一种需求,用来帮助用户从这些海量数据中分析出其间所蕴涵的有价值的模式和知识的技术——数据挖掘技术就应运而生了。聚类分析是数据挖掘领域中一个非常重要的研究内容,它主要是从数据库中的记录集中寻找数据的相似性并进行分类,从而发现数据库中隐含的有用信息。而蚁群聚类算法作为一种自组织、并行的聚

4、类算法,被广泛应用于聚类分析中。本文首先介绍了数据挖掘的基本概念和分析方法,重点介绍了文本聚类分析技术以及文本预处理的相关技术,然后详细介绍了蚁群聚类算法的基本理论。针对蚁群聚类算法的后期收敛速度慢,以及蚂蚁的盲目随机运动导致的聚类效果和聚类效率受到影响,本文提出了改进概率转换函数、添加记忆器官、训练蚂蚁自适应移动从而改进了基本的蚁群聚类算法。本文在文档数据上进行了实验,验证了改进后的蚁群文本聚类算法的有效性。最后,在前面研究的基础上,将改进的蚁群文本聚类算法应用于企业竞争情报系统中,取得了较好的结果。关键词:数据挖掘蚁群聚类算法文本聚类企业竞争情报系统AbstractAbstract

5、Withtherapiddevelopmentofinformationtechnologyandtheconvenienceofinformationacquisition,weareoverwhelmedbytheamountofinformation.Itisanurgentproblemtosolvethathowtoextractknowledgewhichpeopleareinterestedinfromsomuchknowledgeandcompleteaspecifictask.Basedonthisdemand,DataMiningtechnologycomesint

6、obeingwhichhelpspeopletoanalyzetheamountofknowledgewhichimpliesvaluablemodelsandusefulinformation.Asoneoftheimportantcontentsindatamining,clusteringmainlyfocusedontherecordsfromthedatabasetofinddatasimilarityandcategorizethesedata,sothatitcandiscoverusefulinformationhiddeninthedatabase.AntColony

7、ClusteringAlgorithmasakindofselforganization,parallelclusteringalgorithm,iswidelyusedinclusteringanalysis.Thispaperfirstintroducesthebasicconceptsofdataminingandanalysismethods,emphasizesthetextclusteringanalysistechnologyan

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。