数据挖掘在商业领域的运用.doc

数据挖掘在商业领域的运用.doc

ID:61805562

大小:27.00 KB

页数:3页

时间:2021-03-21

数据挖掘在商业领域的运用.doc_第1页
数据挖掘在商业领域的运用.doc_第2页
数据挖掘在商业领域的运用.doc_第3页
资源描述:

《数据挖掘在商业领域的运用.doc》由会员上传分享,免费在线阅读,更多相关内容在应用文档-天天文库

1、学无止境数据挖掘在商业领域的运用1数据挖掘的过程数据挖掘的过程可以理解为以下几个步骤。第一步,数据清理,解决数据的不一致问题、平滑噪声、补充缺失数据、识别并删除离群点。第二步,数据集成,把来自多个文件、数据立方或者数据库中的数据组合在一起。第三步,数据选择、分析、提取数据库中与任务相关的数据。第四步,数据变换,通过数据平滑、汇总、聚集、泛化、规范化、属性构造等操作提高对高维数据的理解,把数据变换统一成适合进行数据挖掘的形式。第五步,数据挖掘,选择合适的数据挖掘算法智能的提取出有用的信息或模式。数据挖掘在于发现有价值的模式,总体来说,数据挖掘的目的可以分为两类:描述性和预测性。描述性挖掘任务用

2、于表示目标数据中数据的一般性质,包括分类、聚类、关联分析、异常检测等,预测性任务在汇总后的数据上进行归纳,作出预测,包括回归、分类等。第六步,模式评估,根据某种度量确定出某些有趣的模式,或由专家来评定其价值和正确性。第七步,知识表示,使用可视化等信息表示方法,向用户展示挖掘出的有用信息和结果分析。以上的步骤是进行数据挖掘的一般过程,对于不同的应用分析过程也不尽相同,在商业领域中,面对来自商业的各种不同的分析任务,首先应该理解该应用领域,对数据分析的背景有一个很好的理解,然后尽可能的按照所需信息进行信息的收集工作。2数据挖掘在商业领域中的重要应用及分析3学海无涯学无止境零售业是非常适合的数据挖

3、掘的商业领域之一,因为它包含了大量的销售记录、顾客购买记录、货物运输记录等大量的原始信息,为数据挖掘提供了丰富的资源。分类和预测技术在市场分析、供应和销售方面为商务智能提供预测分析;聚类可以在客户关系管理方面,根据顾客的相似性把顾客进行分组以便进行更多的后续分析。数据挖掘在商业上的应用具体在以下几个方面:第一,帮助设计和构造数据仓库,由于商业领域中信息范围太大,数据库的设计也存在许多方式,我们可以使用数据挖掘演练结果指导数据库的设计方便以后的使用和后续分析处理。第二,对顾客需求、产品销售、趋势等构造复杂的数据立方体,提供多维分析和可视化工具。第三,根据顾客购买记录,使用序列模式挖掘顾客的消费

4、变化,分析顾客的忠诚程度。第四,产品推荐和商品的交叉推荐,通过销售记录挖掘关联信息,这类信息可以形成产品推荐,也可以根据其他顾客的购买意愿产生个性化购买服务。第五,通过多维分析、聚类分析和林群点分析可以识别可能的欺骗者和他们的习惯模式,检测通过欺骗进入或未经授权访问个人或组织的账户企图,发现可能需要特别注意的不寻常模式。使用数据挖掘技术,可以更好的理解每组顾客的行为特征,开发制定销售计划。3数据挖掘的典型分析方法3.1特征化和区分数据特征化就是简洁的汇总目标数据的一般特征。在商业活动中,公司为保证自己的正常运营和经济效益要保证有一定的客户源。包括不断发展新客户,对已有客户的消费行为和基础信息

5、作为基础综合考虑客户的行为特征,对可能的客户源加强推荐工作。3.2频繁模式和关联规则挖掘频繁模式能找出大部分人的喜好,找出适用范围更广的有趣模式的关联性和相关性。关联规则若能同时满足最小支持度阈值和最小置信度阈值,进一步发现关联的属性-值对之间的有趣的统计相关。关联规则最早是用于解决购物篮分析问题,从购物篮数据中发现顾客的购买规律决定商品的摆放位置。还用于医疗中发现某些症状与某些疾病之间的关联,为诊断提供更多依据。3.3分类与回归分类可以找出描述和区分数据类的模型,以便接下来实现模型预测类标号以及预测位置类别的数据元素。决策树、神经网络是比较常见的用于分类的方法。相关分析是在分类和回归之前进

6、行,识别出显著相关的属性,其他不想管的属性可以暂时不考虑。分类方法用于金融市场营销、市场预测、信用评估、医疗诊断等方面。分类器还可用于预测某些产品的销售情况、广告的投放区域,以及保险业中评估客户的信用等级。3.4聚类(cluster)3学海无涯学无止境与分类不同的是,分类需要一个类别属性,而聚类不需要,它是将数据集划分为由若干相似实例组成簇的过程,使得在同一个簇中数据相似程度最大化,簇间数据相异程度最高。是一种无监督的机器学习方法。涉及到的主要算法有K-means,EM算法和DBSCAN算法。聚类分析可以详细的划分市场,比如,基于客户特征把客户群进行划分,房地产行业中对住宅户型、地理位置等特

7、征来鉴定一个城市的房产分组。3.5离群点分析前面讨论的聚类、分类、关联分析等方法的重点在于发现大多数数据所适用的常规模式。数据集中的数据中可能包含一些与其他数据一般行为不一致的点,这些数据就称为离群点,大部分的离群点在一些有趣模式的挖掘过程中被丢弃,然而,在一些其他方面,可以直接将离群点单独拿出来做分析。比如应用于灾害气象预报、欺诈检测、药物异常反应、网络安全入侵检测等领域。4数据挖掘的分析软件和展示工具无论

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。