数据挖掘的关键词统计关联分析

数据挖掘的关键词统计关联分析

ID:15693298

大小:770.50 KB

页数:51页

时间:2018-08-04

数据挖掘的关键词统计关联分析_第1页
数据挖掘的关键词统计关联分析_第2页
数据挖掘的关键词统计关联分析_第3页
数据挖掘的关键词统计关联分析_第4页
数据挖掘的关键词统计关联分析_第5页
资源描述:

《数据挖掘的关键词统计关联分析》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、毕业设计设计题目基于数据挖掘的关键词统计关联分析学生姓名学号专业班级指导教师院系名称计算机与信息学院2015年6月12日目录中文摘要1英文摘要2第一章绪论31.1课题研究的背景及意义31.2国内外研究现状41.3本文主要研究内容51.4本文组织结构52.1数据挖掘的定义72.2数据挖掘中的有趣故事82.3数据挖掘的几种表示方式和模式82.3.1广义知识挖掘。82.3.2关联数据挖掘。92.3.3类知识挖掘92.3.4预测型知识挖掘92.3.5特异型知识挖掘102.3.6粗糙集知识挖掘。102.4数据预处理。102.5数据挖掘的算法102.5.1分类算法102.5.2预测算法122.5.3聚类算

2、法122.5.4关联算法13第三章关键词的关联分析133.2apriori说明。143.3Apriori算法的描述 143.4apriori算法在此次设计的应用163.5一种Apriori的改进算法 19第四章系统设计与实现194.1设计原理。204.2设计环境及主要模块。204.2.1数据的关键词统计分析204.2.2数据的频繁关联关系234.2.3数据的关联分析24第五章数据挖掘关联规则的研究热点及未来展望255.1数据挖掘的研究热点265.2数据挖掘的未来展望。27结论28致谢30参考文献30 31附录31基于数据挖掘的关键词统计关联分析摘要:本次设计主要是在自然基金科学网上爬取数据,用

3、以作为实验的数据库,然后在网页上做统计和关联分析,来具体分析自然科学基金的研究热点以及研究趋势分析。首先对关键词频率做了充分的统计,然后对统计的数据做了具体的关联分析,结果显示最终的关联度最高的关键词,从而得出与这些关键词相关的自然基金项目是有很大关系结论。在不偏离主题目标的情况下本文还研究了除去关联规则算法的其他几类数据挖掘算法,主要有聚类算法、分类算法、预测算法。用以和关联规则算法做具体的对比从而使本文的内容更加的丰富充实。关键词:数据挖掘;关联分析;关键词统计47BasedonthekeywordsstatisticalcorrelationanalysisofdataminingAbs

4、tract:Thisdesignmainlyinthefieldofnaturalsciencefundcrawldataonline,toasexperimentdatabase,thendostatisticsandcorrelationanalysisonthewebpage,tospecificanalysisofthenaturalsciencefoundationresearchhotspotandtrendanalysis.Firsttofullythekeywordfrequencystatistics,thenthecorrelationanalysisofthestatis

5、ticaldatafortheconcrete,theresultsshowthehighestcorrelationkeywords,whichindicatesthatthenaturalfundprojectassociatedwiththesekeywordsarehasalottodo.Inthecaseofnotdeviatefromthetopicgoalthispaperalsostudiedtheremoveseveralotherkindsofdataminingalgorithmofassociationrulesalgorithm,clusteringalgorithm

6、,classificationalgorithmandpredictionalgorithm.DotoandassociationrulesalgorithmcontrasttomakethecontentofthisarticlemoreabundantlyKeywords:datamining;associationanalysis;keywordstatistics47第一章绪论1.1课题研究的背景及意义就目前而言,关联规则挖掘技术已经被广泛应用在西方金融行业企业中,它可以成功预测银行客户需求。一旦获得了这些信息,银行就可以改善自身营销。现在银行天天都在开发新的沟通客户的方法。各银行在自

7、己的ATM机上就捆绑了顾客可能感兴趣的本行产品信息,供使用本行ATM机的用户了解。如果数据库中显示,某个高信用限额的客户更换了地址,这个客户很有可能新近购买了一栋更大的住宅,因此会有可能需要更高信用限额,更高端的新信用卡,或者需要一个住房改善贷款,这些产品都可以通过信用卡账单邮寄给客户。当客户打电话咨询的时候,数据库可以有力地帮助电话销售代表。销售代表的电脑屏幕上可以显示出客户的特点,同时也可以显

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。