数据挖掘技术在客户分析中的应用

数据挖掘技术在客户分析中的应用

ID:34511176

大小:319.94 KB

页数:6页

时间:2019-03-07

数据挖掘技术在客户分析中的应用_第1页
数据挖掘技术在客户分析中的应用_第2页
数据挖掘技术在客户分析中的应用_第3页
数据挖掘技术在客户分析中的应用_第4页
数据挖掘技术在客户分析中的应用_第5页
资源描述:

《数据挖掘技术在客户分析中的应用》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、http://www.paper.edu.cn数据挖掘技术在客户分析中的应用122祖巧红胡吉全陈定方(1,2.武汉理工大学物流工程学院,武汉430063)摘要:本文对五种数据挖掘预测算法分别进行介绍,并结合实例对各种方法适用的情况进行了比较,以便在对客户的不同情况进行分析的时候采取有效的预测方法。其中,回归预测是比较传统的预测方法,常根据历史记录分析得出总体趋势;决策树方法是一种类似于“枝丫”形状的“二分制”数据分析和预测方法,主要用于对数据进行归类分割和预测,来解决定性分析的问题;神经网络方法主要对客户行为进

2、行分析和预测,从定量的角度进行分析;聚类和邻点预测方法主要是对未来数据进行预测;规则导引则是从一个样本数据库中发现并归纳出“数据行为”模式。关键词:数据挖掘决策树神经网络聚类邻点预测1.综述理论上,数据挖掘技术或方法有很多,技术的“变种”也不少,数据仓库技术也支持多种预测模型以便对客户进行相应的分类和分析,针对各种具体情况,采取不同的预测方法是我们在进行客户分析中非常迫切解决的问题,因此我们有必要对它们进行分析比较。2.常用的预测方法2.1回归预测回归预测是比较传统的预测方法,是根据历史记录分析得出总体趋势,并

3、将这种趋势用某种数学方程式表示。利用这个方程式,就可以输入未来的一个或多个变量计算出预测结果。如果方程式的变量是一次方的,那么就称为直线线性回归,如果是多次方的,称为曲线线性回归。最简单的一元线性回归预测预测模型为Y=a+bX。一个实用的一元线性预测模型的建立就是为用户提供一个求解参数a和b的过程。不断输入历史数据X和Y值,反复校准,反复验证,直到求解出误差率最小的参数,并确定a和b的值。计算机运算大量的数据的能力是非常强大的,利用误差比较法不断对参数进行修正便可以得到最佳模型。现实生活中问题,其预测模型就会变

4、为多元多次的,其数学模型为Y=a+b1X1+b2X2+b3X3+…+bnXn。当然对于参数求解法的整个过程还是一样的,对于人脑是无法想像,但对于可以高速处理数据的电脑,再复杂的模型都是可以得出结果的,至于结果准确不准确,有赖于历史数据的多寡以及很多其他的“不可测因素”的干扰程度了。2.2决策树决策树是一种类似于“枝桠”形状的“二分制”数据分析和预测方法,主要用于对数据进行归类分割和预测。决策树运用最多的是,市场营销部门根据客户的特征,对客户大市场进行“分割”,从而得到相对较小的客户群体。这样市场预算有限的情况下

5、,可以针对性地-1-http://www.paper.edu.cn开展市场营销活动,从而节省资金,避免浪费,提高促销活动地汇报率。另外,决策树也广泛用于其他数据挖掘工具,如神经网络地数据预处理工具,通过对数据地初步探索,找出最相关地变量集。图1对客户流失情况进行分析预测的决策树例子图1是一个典型的对“流失客户”特征进行分析的决策树,每个“树丫”的生长,表示了流失客户的进一步划分,直到这个树丫无法继续细分,或者说,这个树丫所代表的客户群其性质“相当类似”,任何更多的细分都没有什么意义了,这就是树的“枝末”,也是最

6、后的最小分割,如果这种最小分割达到一个客户,就是所谓的“一对一营销”的理想境界了。营销人员便可以对一个或多个“枝末”客户进行促销,以实现留住客户,提高促销成功率的目的。决策树的目的是对一个数据样本进行最大限度的分割,也就是让这棵树得到合理生长。要坐到这一点,对每个节点所提的问题要尽量有效,并且,所有问题要尽量同要探索的业务目的相关。在对一个数据样本分析之前,如何知道哪些问题是相关的,哪些问题是不相关的呢?如果知道了,那也失去了数据挖掘的意义了,因为数据挖掘的目的就是为了找到隐含的、尚未明了的某种行为模式。在进行

7、决策树分析时,首先要明确到底要分析什么,目的是什么,这点是很重要的,并且,提供学习的样本数据要尽量多而且准确。支持决策树模型的数据仓库产品中,提供了“决策树”生长得机制,计算机可以帮助我们优化树的生长,一个问题不是很有效,用另外一个,直到找到每个级别都是最优分割为止。在预测方面,企业可以根据需要“生长”多棵树,经大量时间证明后,可以成为企业特有的有效预测模型,提高决策能力。比如,客户行为预测的多个决策树(类比于决策“森林”)可以包括客户获利能力预测树,再购买可能性预测树,连带销售可能性树以及流失可能性树等。每个

8、部门,每个企业的情况千差万别,因而预测树-2-http://www.paper.edu.cn的大小、预测逻辑也都不一样。2.3神经网络人脑基本上是由神经细胞组成的,称为神经元。每个神经元接收来自其他神经元的输入,经过处理后,向其他神经元输出。用于数据挖掘的神经网络技术其实就是对人脑对信息处理的简单模拟,人工神经网络系统的“神经元”,基本上模拟人脑神经元处理过程,以最简单的乘积之和(输入

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。