《数据挖掘》word版

《数据挖掘》word版

ID:33923629

大小:271.00 KB

页数:19页

时间:2019-02-27

《数据挖掘》word版_第1页
《数据挖掘》word版_第2页
《数据挖掘》word版_第3页
《数据挖掘》word版_第4页
《数据挖掘》word版_第5页
资源描述:

《《数据挖掘》word版》由会员上传分享,免费在线阅读,更多相关内容在应用文档-天天文库

1、李晓卫基于数据挖掘的国际贸易客户流失的预测分析二00九年四月十一日目录1前言………………………………………………………………………………21.1设计背景………………………………………………………………………21.2数据挖掘简介…………………………………………………………………21.3决策树ID3和C4.5算法简介………………………………………………32客户数据训练集的预处理………………………………………………………32.1选择训练集……………………………………………………………………42.2去除训练集的冗余数据…………………………

2、……………………………42.3训练集中连续值的离散化……………………………………………………43结合信息增益和信息增益率进行决策树归纳…………………………………63.1计算对D中元组分类所需的期望信息………………………………………63.2计算每个属性的期望信息需求(即信息熵)………………………………73.3计算每个属性的信息增益率………………………………………………144构建决策树……………………………………………………………………164.1构建根节点决策树…………………………………………………………164.2构建最终决策树………

3、……………………………………………………175客户群流失的预测和分析……………………………………………………176总结……………………………………………………………………………182李晓卫基于数据挖掘的国际贸易客户流失的预测分析结束语……………………………………………………………………………18致谢………………………………………………………………………………18参考文献…………………………………………………………………………18附录………………………………………………………………………………19基于数据挖掘的国际贸易客户流失的预测

4、分析李晓卫(电子信息工程学系指导教师:黄海)摘要:企业客户流失是一个企业最大的损失,但大部分企业并未找到一个切实有效的方法来解决这个问题,文章从数据挖掘角度,利用关联规则对国际贸易客户流失的预测进行一些分析,找出流失率比较高的并有价值的客户群体的特点,为企业提供一些具体策略来减少客户流失,最终获得较大的经济效益!关键词:数据挖掘客户流失决策树ID3算法c4.5算法离散化Abstract:Lossofbusinesscustomersarethebiggestlossofanenterprise,butmostenterprises

5、haveNtfoundaneffectivewaytosolvethisproblem,dataminingarticlefromthepointofview,theuseofassociationrulesoninternationaltradethelossofcustomerstoconductsomeanalysisofthepredictiontoidentifythelossofrelativelyhighrateandvaluablecharacteristicsofclientgroups,providinganu

6、mberofspecificstrategiestoreducethelossofcustomers,andultimatelytheecoNmicbenefitsofalarger.Keywords:DataMining,Thelossofcustomers,DecisionTree,ID3algorithm,c4.5algorithm,Discretization2李晓卫基于数据挖掘的国际贸易客户流失的预测分析1前言1.1设计背景随着中国加入世贸组织,互联网信息化高速发展带来的机遇,有着越来越多的企业或者个人)参加到国际贸易当

7、中并从中获利,在营销和推广的手段的多元化的同时,客户群成了一个非常不稳定的群体,商人无非重视的是个利字,那么这些客户群很有可能会流向竞争对手那里,那么如何提升公司客户群的忠诚度就成为了首要解决的问题,为了满足外贸企业和外贸soho对客户流的需求以及掌控,由于数据量的复杂,也就非常有必要开发一个基于数据挖掘的国际贸易客户流失数据预测处理系统来来管理客户数据和预防客户的流失,这样不仅可以及时检测到客户的流失动向和原因,而且也为外贸企业外贸soho提供了更加快捷的方式来尽量减少客户端流失。1.2数据挖掘简介数据挖掘(datamining

8、)是从大量的、不完全的、有噪声的、模糊的、随机的数据中提取隐含在其中的、人们事先不知道的、但又是潜在有用的信息和知识的过程。随着信息技术的高速发展,人们积累的数据量急剧增长,动辄以tb计,如何从海量的数据中提取有用的知识成为当务之急。数据挖掘就是为

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。