数据挖掘技术及其应用new

数据挖掘技术及其应用new

ID:34441194

大小:218.64 KB

页数:3页

时间:2019-03-06

数据挖掘技术及其应用new_第1页
数据挖掘技术及其应用new_第2页
数据挖掘技术及其应用new_第3页
资源描述:

《数据挖掘技术及其应用new》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、随着网络技术的迅速发展以及数取信息的质量依赖于用户对结果的理据库系统的广泛应用,人们积累的数解,容易导致错误。因此,传统的数据据越来越多,激增的数据中有大量重分析是由用户驱动的,很大程度上受要信息。目前的数据库系统虽然可以到用户水平的限制,具有一定的局限高效地实现数据的录入、查询、统计等性。而数据挖掘是在没有明确假设的功能,但无法发现数据中存在的关联前提下去挖掘信息、发现知识,用户不和规则,无法根据现有的数据预测未必提出明确的要求,系统能够根据数来的发展趋势,缺乏挖掘数据背后隐据本身的规律性,自动地挖掘数据潜藏的知识的手段。在这种情况下,人们在的模式,或通过联想建立新的业务引入了数据挖掘思想

2、,通过它预测未模型,帮助决策者调整市场策略,这有来的趋势和行为,作出超前的、基于知利于发现未知的事物。因此,它是由数识的决策。据驱动的一种真正的知识发现方法。数据挖掘概述在商业应用中一个典型的例子是,一1.数据挖掘。数据挖掘是从大量家连锁店通过数据挖掘发现了小孩尿的、不完全的、驳杂的、模糊的、随机的布和啤酒之间有着惊人的联系。数据中提取隐含在其中的、人们事先3.数据挖掘的常用方法。数据挖掘不知道的,但又对决策有潜在价值的技术综合了多个学科技术,目前常用信息和知识的过程。因为与数据库密的方法有:切相关,所以数据挖掘又称为数据库(1)分类。分类是找出一个类别的知识发现。这些数据可以是结构化的,概

3、念描述,并用这种描述来构造模型。如关系型数据库中的数据;也可以是分类的目的是通过统计方法、机器学习半结构化的,如文本、图形、图像数据;方法(包括决策树法和规则归纳法)、神还可以是分布在网络上的异构型数经网络方法等构造一个分类模型,然后据。发现知识的方法可以是数学的,也数据把数据库中的数据映射到给定类别中可以是非数学的;可以是演绎的,也可的某一个类别中去。分类可用于规则描以是归纳的。发现的知识可用于信息挖掘述和预测,如银行部门根据以前的数据管理、查询优化、决策支持、过程控制将客户分成了不同的类别,现在就可以等,还可用于数据自身的维护。根据这些类别来区分新申请贷款的客2.数据挖掘的特点。数据挖掘

4、与传技术户,以采取相应的贷款方案。统的数据分析(如查询、报表、联机应(2)估计与预测。估计是根据有连用分析等)有本质的区别:数据挖掘是及其续性数值的相关属性资料,以获得某在没有明确假设的前提下去挖掘信一属性未知的值。例如,按照信用申请息、发现知识,所得到的信息具有事先者的教育程度、行为和性别来推估其未知、有效、实用三个特征;传统的数应用信用卡的消费量。估计通常使用统计据分析方法是一种验证型的分析,它学的相关分析、回归分析和人工神经是在某个假设的前提下通过数据查询网络方法。预测是利用历史数据找出和分析来验证这个假设。它以假设为■重庆/杨理云变化规律,建立模型,并由此模型对未基础,但由于用户的假

5、设能力有限,往来数据的种类和特征进行预测。预测往只能局限于对几种变革进行假设;关心的是精度和不确定性,例如由顾同时,它需要对用户的需求有全面和客过去刷卡消费量预测其未来刷卡消深入的了解,然而实际上有些时候用费量。预测通常使用回归分析、时间数户的需求并不是完全确定的;再者,抽列分析和人工神经网络等方法。55(3)关联分析。关联分析是要发现及与之相关的预处理、抽样和数据变要的领域。通过数据挖掘,对市场进行大量数据中项集之间有趣的关联或相换的一个过程。它是一个交互式的迭定位;通过对消费者的分析,识别顾客关联系,从而为某些决策提供必要支代过程,通常可分为数据挖掘预处理、的购买行为模式,预测销售趋势,

6、优化持,它是数据库中存在的一类重要的、数据挖掘和数据挖掘后处理三个过营销策略;通过对库存需求的分析,协可被发现的知识,被广泛应用于决策支程。可按如下过程进行数据挖掘:助货架布置,制定促销活动时间、促销持系统。例如,从一家超市的数据仓库1.了解应用领域。了解应用领域内商品组合以及了解滞销和畅销商品状中,可以发现的一条典型关联规则可能有关的先验知识和应用目标,为数据况等商业活动;通过收集、加工和处理是“买面包和黄油的顾客十有八九也买库知识发现获取领域知识。涉及消费者消费行为的大量信息,确牛奶”,也可能是“买食品的顾客几乎都2.生成目标数据集。包括数据集的定特定消费群体或个体的兴趣、消费用信用卡”

7、,这些发现对于商家实施客选择或变量子集的聚集或数据抽样。习惯、消费倾向和消费需求,进而推断户化的销售计划和策略是非常有用的。3.数据过滤与预处理。为模型进行出相应消费群体或个体下一步的消费(4)聚类分析。数据库中的记录可必要的信息收集,对噪声进行说明,操行为,然后以此为基础,对所识别出的被划分为一系列有意义的子集,即聚纵丢失的数据域的策略选择,对时间消费群体进行特定内容的定向营销。类。聚类是把一组个体按照相似

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。