数据挖掘技术与电信客户分析.pdf

数据挖掘技术与电信客户分析.pdf

ID:57829493

大小:623.25 KB

页数:5页

时间:2020-04-09

数据挖掘技术与电信客户分析.pdf_第1页
数据挖掘技术与电信客户分析.pdf_第2页
数据挖掘技术与电信客户分析.pdf_第3页
数据挖掘技术与电信客户分析.pdf_第4页
数据挖掘技术与电信客户分析.pdf_第5页
资源描述:

《数据挖掘技术与电信客户分析.pdf》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、Business&Operation业务与运营数据挖掘技术与电信客户分析李净张范张智江中国联合网络通信有限公司博士后工作站北京100140Business&Operation摘要数据挖掘技术以其跨学科、算法丰富及处理海量数据的特点而被广泛应用于金融、零售、电信等领域的客户分析中,帮助企业深入细分客户,提升客户体验,增加企业收入。我国电信运营商正面临着激烈的市场竞争,对深入细分客户的需求也日益强烈,对数据挖掘技术的跟踪与应用的需求十分迫切。本文深入探讨数据挖掘方法论、技术方法及其在电信客户分析中的应用,指出应用中要注意的问题,为对电信客户进行分析提供了参考。关键词数据挖掘;电信;客户分析起来,形

2、成了“数据丰富,知识贫乏”的状况,因此,引言如何从海量数据中挖掘有用的知识,变得非常重要,数金融、零售、电信等企业都积累了大量客户数据,据挖掘技术就是在这种背景下诞生的。这些数据是企业的重要资产和财富。通过深入分析,可从数据挖掘的概念看,其特点主要体现在两点:以从中获取大量有用的信息。数据挖掘是处理此类海量一是处理大数据集的能力,作为数据挖掘可以吸取多学数据,从中挖掘有用信息的常用技术,应用广泛。如,科的大量算法,通常需要加强算法的可扩展性以处理海沃尔玛超市拥有世界上最大的数据仓库系统,利用数量数据;二是“探索”或“挖掘”过程,数据挖掘强调据挖掘工具分析客户购买行为;中科院利用数据挖掘从海量数

3、据中获取知识的过程,通过探索的方式,利用技术为银行建立客户信用度评估系统;法国电信,英国各种方法从大量数据中挖掘可能有用的模型或模式;因电信,AT&T,SKT,DoCoMo及国内电信运营商都已此,数据挖掘更侧重于方法论,而非具体的算法。SIG[1]在客户分析中采用了数据挖掘技术,以提升客户洞察能组织在1996年提出的数据挖掘标准流程CRISP-DM,力,提高企业竞争力。是一种被广泛应用的跨行业的处理流程,如图1所示。[2]在激烈的竞争环境下,我国电信运营商也越来越重SAS也提出了一种数据挖掘方法论SEMMA,并应用视客户分析工作。如何利用数据挖掘技术分析处理规模于SAS系统中。巨大的电信业务运

4、营数据,解决客户发展成本高、流失率高、个性化服务需求高、客户满意度低等问题,是我国电信企业最为关注的内容。本文将深入探讨数据挖掘业务理解数据理解技术与电信客户分析相关问题,以作为电信客户分析的数据准备参考。数据部署1数据挖掘方法论建模数据挖掘(DataMining)是从大量数据中提取或挖掘知识的过程。数据挖掘是一个新兴的多学科交叉领评估域,起源于20世纪80年代,在决策支持中扮演着重要的角色。随着数据库技术的发展,越来越多的数据被收集图1CRISP-DM标准流程20090543CRISP-DM流程分为六个阶段,详细说明见表1:解,所使用的技术方法也与自身专业相关,这就给数据挖掘带来了丰富的算法

5、。从某种角度说,凡是可以用户表1CRISP-DM步骤说明步骤描述从数据中挖掘知识的技术方法,都可以纳入数据挖掘范业务理解通过反复沟通准确理解业务问题,将其转换成数据挖掘问畴中。总体上,数据挖掘中采用的方法可以划分为以下题,并拟定初步构想业务与运营数据理解收集、理解、过滤所需的数据,并进行数据质量评估几类:数据预处理数据清理、转换、归并等,便于数据挖掘技术使用2.1数据泛化(datageneralization)建模尝试采用各种方法建立分析模型,解决提出的业务问题评估对建立的模型进行评估数据泛化是对数据进行抽象与汇总的过程。可以利部署最终报告生成或模型部署用业务知识或采用属性归纳等方法生成属性的

6、概念层次从流程图中可以看出,数据挖掘过程是一个循环往树,并利用这种层级关系对数据进行泛化。汇总是一种[3]复、不断优化的闭环流程。其中,“业务理解”与“数常用的数据泛化方法。另外,OLAP分析是数据泛化据理解”之间、“数据准备”与“建模”之间都存在着的一个具体应用,用于发现隐藏在不同数据粒度层级上反复过程,正体现出了“挖掘”、“探索”的特点。首的知识。先,数据挖掘过程应是业务主导而非技术主导,深入2.2关联分析(associationanalysis)理解业务问题和数据内涵对数据挖掘项目的成功非常关联分析主要用于发现大数据集中数据项之间的重要。这个过程需要业务人员和分析人员共同参与,深关联关系

7、、相关关系等,可采用关联规则挖掘、相关分入沟通,明确分析的目标、理解业务数据、确定数据需析、主成分分析,频繁项目集等方法。其中用于查找频[6]求、评估数据质量。其次,分析时常采用探索的方式,繁项目集的Apriori算法可以认为是数据挖掘技术中的尝试多种数据挖掘技术来进行建模。在此过程中,可能原创性算法。出现数据不足的问题,这就需要继续丰富数据,也可能2.3聚类(clustering)出现模型效果不

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。