数据挖掘-毕业论文外文翻译

数据挖掘-毕业论文外文翻译

ID:4042430

大小:27.06 KB

页数:6页

时间:2017-11-28

数据挖掘-毕业论文外文翻译_第1页
数据挖掘-毕业论文外文翻译_第2页
数据挖掘-毕业论文外文翻译_第3页
数据挖掘-毕业论文外文翻译_第4页
数据挖掘-毕业论文外文翻译_第5页
资源描述:

《数据挖掘-毕业论文外文翻译》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、本科毕业论文(设计)外文文献翻译 外文文献译文数据挖掘2应用领域数据挖掘是广泛用于一系列科学学科和业务场景。一些值得注意的例子:管理、机器学习贝叶斯-伊恩推理、知识获得专家系统、模糊逻辑、神经网络和遗传算法。在日常业务场景的例子:包括航空公司、数据库营销面板数据的研究和创造,基于定制的贸易出版物为数百种不同的用户数据用户组。Piatetsky-Shapiro与相关学术人员在99年提供一个详细的进一步的使用领域的概述。是另一个国际米兰——毛利分析美国东部时间在数据挖掘领域的研究。现代成本会计的帮助下软件公司可以对个人所得税进行多维分析物品。由于大量引用(e.g.产品客户托马、销售渠道、区域)和需

2、要的对象的数量检查控制器需要方法自动识别数据模式。在这种情况下,这些模式的组合属性值(e.g。“DIY商店”和“力量训练”)以及(e.g.毛利率)措施。一个公司,开发数据挖掘程序必须也考虑到大量数据参与。即使在一个中型公司是很常见的,成百上千项流入每月损益表。基于案例的推理(CBR)是其中之一数据最小的有趣的例子荷兰国际集团(ING)和机器学习在一起。CBR组件尝试跟踪当前问题的问题已经解决了过去。帮助桌子,协助澄清的问题客户有购买产品,是一个实际的使用类型的过程。尽管一些公司使用帮助台支持他们的电信电话热线,其他人给他们定制-人通过远程数据的直接访问转移。可以非常价值——数据挖掘在这种情况下

3、,因为它巩固聚集在成千上万的信息关键的发现——个人历史病例老年男性。这种方法的优点是较短的过程,寻找先例可以用来回答当前客户的问题。3方法有许多不同类型的方法分析和分类数据。一些常见的方法包括聚类分析、贝叶斯推理和归纳学习。可以使用聚类分析基于数值以及措施概念聚类的形式。数据挖掘系统的结构天生是非常不同的,当然这些都很常见的:因为分析方法,识别和分析模式,是系统的核心。因为输入可以包括组件原始数据等信息数据字典、知识的使用场景中,或缩小用户条目搜索过程。因为输出包含发现措施,规则或信息在一个适当的形式呈现给用户,纳入系统作为新知识或集成成一个专家系统。3.1聚类分析不论在其传统的形式还是概念聚

4、类,聚类分析试图分裂或合并一组数字基于误码率的对象组接近这些对象之间的存在。集群分组以便有大的对象之间的相似之处类以及大型之间的异同不同的类的对象。3.1.1传统聚类分析不管的缩放级别对象变量,有多种方法衡量相似性和区别的距离。基本的例子包括欧几里得(即平方根总平方差异)和曼哈顿差异(即绝对的总和个体差异变量)。在我们可以检查指标,名义以及不同数据集的混合距离测量。当对象有不同的类型的属性,例如,考夫曼和Rousseeuw推荐计算个人名义的差异为0属性值是相同的,和不同的是不同的。指标变量,我们第一次需要建立之间的区别对象的值。然后我们标准化把他们的最大区别。结果是一个0和之间的差异。然后我们

5、计算总差异两个对象之间的向量的总和个体差异(考夫曼和Rousseeuw990)。我们可以使用这种类型的测量(最终延长individ——的重量性属性)集群生产总值(gdp)数据集边际分析。这些包含名义属性(如产品、客户、地区)以及数值(收入或措施毛利率)。有一个普遍的分化在划分和层次之间分类方法。简而言之,合适的婚姻对象一对迭代方法试图最小化一个给定的初始分配——的异质性表示“状态”的对象到集群。分层方法,这几乎是重要的,采取一种完全不同的方法。最初,每一个对象都位于自己的俱乐部怪兽。然而,对象,然后结合先后,因此只有最小程度的同质性是迷失在每一个步骤。我们可以很容易地生成的层次结构嵌套的集群在

6、一个所谓的系统树图。3.3归纳学习让我们假设有一个给定的一组对象(即一个训练集)类。归纳学习试图定义一个规则,基于其组织一个新对象属性到一个现有的类。一个常见的方法是可视化作为一个决策树学习规则。树叶而树的代表类主要降低分支机构代表测试分别检查一个属性值。每个测试接收的可能的结果自己的分公司,反过来,导致到另一个分支或熊一片叶子。的ID算法,一个著名的例子这种方法,从这一段开始训练集,我们可以在几个迭代建立一个树与0000集对象和50属性。ID子结果把剩下的对象的训练集,如果分类不正确,算法将重启一个训练集的扩展部分的对象是不正确的分类(昆兰986)。银行,例如,可以使用一个方法构建和维护这样

7、一个专业的系统检查的信用评级个人客户。如果一个训练集包含一个大客户群体高或低信用评级,该算法可以使用规则来评估未来的贷款申请,银行员工可以处理在系统中。4关键因素以下部分概述了一些与数据挖掘相关的问题。在我们认为,这些关键因素的成功将为未来打下坚实的基础研究和发展。4.1算法的效率关于数据挖掘的效率算法,我们应该考虑以下方面。jCalculation时期是一个关键因素。如果算法的计算时间增长速度比

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。