机器学习与数据挖掘的关系.doc

机器学习与数据挖掘的关系.doc

ID:28101271

大小:611.50 KB

页数:10页

时间:2018-12-08

机器学习与数据挖掘的关系.doc_第1页
机器学习与数据挖掘的关系.doc_第2页
机器学习与数据挖掘的关系.doc_第3页
机器学习与数据挖掘的关系.doc_第4页
机器学习与数据挖掘的关系.doc_第5页
资源描述:

《机器学习与数据挖掘的关系.doc》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、机器学习与数据挖掘的关系前言  在大多数非计算机专业人士以及部分计算机专业背景人士眼中,机器学习(DataMining)以及数据挖掘(MachineLearning)是两个高深的领域。在笔者看来,这是一种过高”瞻仰“的习惯性错误理解(在这里我加了好多定语)。事实上,这两个领域与计算机其他领域一样都是在融汇理论和实践的过程中不断熟练和深入,不同之处仅在于渗透了更多的数学知识(主要是统计学),在后面的文章中我会努力将这些数学知识以一种更容易理解的方式讲解给大家。本文从基本概念出发浅析他们的关系和异同,不讲具体算法和数学公式。希望对大家能有所帮助。几个相关示例  首先,给

2、大家列举一些生活中与数据挖掘、机器学习相关的应用示例以帮助大家更好的理解。  示例1(关联问题):  经常去超市的同学可能会发现,我们事先在购物清单上列举好的某些商品可能会被超市阿姨摆放在相邻的区域。例如,机器学习与数据挖掘的关系前言  在大多数非计算机专业人士以及部分计算机专业背景人士眼中,机器学习(DataMining)以及数据挖掘(MachineLearning)是两个高深的领域。在笔者看来,这是一种过高”瞻仰“的习惯性错误理解(在这里我加了好多定语)。事实上,这两个领域与计算机其他领域一样都是在融汇理论和实践的过程中不断熟练和深入,不同之处仅在于渗透了更多的

3、数学知识(主要是统计学),在后面的文章中我会努力将这些数学知识以一种更容易理解的方式讲解给大家。本文从基本概念出发浅析他们的关系和异同,不讲具体算法和数学公式。希望对大家能有所帮助。几个相关示例  首先,给大家列举一些生活中与数据挖掘、机器学习相关的应用示例以帮助大家更好的理解。  示例1(关联问题):  经常去超市的同学可能会发现,我们事先在购物清单上列举好的某些商品可能会被超市阿姨摆放在相邻的区域。例如,面包柜台旁边会摆上黄油、面条柜台附近一定会有老干妈等等。这样的物品摆放会让我们的购物过程更加快捷、轻松。  那么如何知道哪些物品该摆放在一块?又或者用户在购买某

4、一个商品的情况下购买另一个商品的概率有多大?这就要利用关联数据挖掘的相关算法来解决。  示例2(分类问题):  在嘈杂的广场上,身边人来人往。仔细观察他们的外貌、衣着、言行等我们会不自觉地断论这个人是新疆人、东北人或者是上海人。又例如,在刚刚结束的2015NBA总决赛中,各类权威机构会大量分析骑士队与勇士队的历史数据从而得出骑士队或者勇士队是否会夺冠的结论。  在上述第一个例子中,由于地域众多,在对人进行地域分类的时候这是一个典型的多分类问题。而在第二个例子中各类机构预测勇士队是否会战胜骑士队夺冠,这是一个二分类问题,其结果只有两种。二分类问题在业界的出镜率异常高,

5、例如在推荐系统中预测一个人是否会买某个商品、其他诸如地震预测、火灾预测等等。  示例3(聚类问题):  ”物以类聚,人以群分“,生活中到处都有聚类问题的影子。假设银行拥有若干客户的历史消费记录,现在由于业务扩张需要新增几款面对不同人群的理财产品,那么如何才能准确的将不同的理财产品通过电话留言的方式推荐给不同的人群?这便是一个聚类问题,银行一般会将所有的用户进行聚类,有相似特征的用户属于同一个类别,最后将不同理财产品推荐给相应类别的客户。  示例4(回归问题):  回归问题或者称作预测问题同样也是一个生活中相当接地气的应用。大家知道,证券公司会利用历史数据对未来一段时

6、间或者某一天的股票价格走势进行预测。同样,房地产商也会根据地域情况对不同面积楼层的房产进行定价预测。  上述两个示例都是回归问题的典型代表,这类问题往往根据一定的历史数据对某一个指定条件下的目标预测一个实数值。  相信经过上面通俗易懂的示例,大家应该初步了解数据挖掘以及机器学习会应用到哪些问题之上(这里列举的四类问题是很常见的,当然还有例如异常检测等应用),这就解决了面对一个新问题三要素中的Why。下面解释什么是机器学习与数据挖掘(即What)以及他们的关系和异同点。数据挖掘  数据挖掘(Datamining),又译为资料探勘、数据采矿。它是数据库知识发现(英语:K

7、nowledge-DiscoveryinDatabases,简称:KDD)中的一个步骤。数据挖掘一般是指从大量的数据中通过算法搜索隐藏于其中信息的过程。数据挖掘通常与计算机科学有关,并通过统计、在线分析处理、情报检索、机器学习、专家系统(依靠过去的经验法则)和模式识别等诸多方法来实现上述目标。  从上面的定义可以看出数据挖掘相对于机器学习而言是一个更加偏向应用的领域。实际上,数据挖掘是一门涉及面很广的交叉学科,在处理各种问题时,只要我们清楚了业务逻辑那么就可以将问题转换为挖掘问题。  数据挖掘的处理过程一般包括数据预处理(ETL、数据清洗、数据集成等),数据仓库

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。