大数据核心技术之数据挖掘与机器学习技术探索培训大纲

大数据核心技术之数据挖掘与机器学习技术探索培训大纲

ID:16924042

大小:46.50 KB

页数:6页

时间:2018-08-25

大数据核心技术之数据挖掘与机器学习技术探索培训大纲_第1页
大数据核心技术之数据挖掘与机器学习技术探索培训大纲_第2页
大数据核心技术之数据挖掘与机器学习技术探索培训大纲_第3页
大数据核心技术之数据挖掘与机器学习技术探索培训大纲_第4页
大数据核心技术之数据挖掘与机器学习技术探索培训大纲_第5页
资源描述:

《大数据核心技术之数据挖掘与机器学习技术探索培训大纲》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库

1、时间培训大纲内容第一天上午第一章机器学习及数据挖掘基础原理1)什么是机器学习?2)什么是数据挖掘?3)什么是大数据?4)典型应用5)机器学习基本思想与原理a)假设空间b)主要流派(机械学习/示教学习/类别学习/归纳学习)c)归纳学习(有监督的学习/无监督的学习)6)机器学习应用的一般流程(收集数据/准备数据/分析数据/训练/测试/应用)7)大数据下机器学习算法的特点8)基础知识a)常见文本处理流程(分词、词性标注、实体识别、句法分析、索引)b)向量空间模型c)高维数据降维c)相似度计算方法d)基本概率统计知识9)常用工具第一天下午第二章机器学习及数据挖掘常用技术

2、1)分类方法a)特征选择及降维b)朴素贝叶斯c)决策树d)回归分类器locatedintheTomb,DongShenJiabang,deferthenextdayfocusedontheassassination.Linping,Zhejiang,1ofwhichliquorwinemasters(WuzhensaidinformationisCarpenter),whogotAfewbayonets,duetomissedfatal,whennightcame第二天上午第二章机器学习及数据挖掘常用技术a)中心向量法b)KNNc)SVMd)线性分类器1)分类的

3、研究进展及趋势a)大数据下的分类算法b)情感分析c)众包标注第二天下午第二章机器学习及数据挖掘常用技术2)常见聚类算法a)k-Meansb)层次聚类c)DBSCAN3)聚类的研究进展及趋势a)大数据下的聚类算法b)Science上最新发表的聚类算法c)社交网络中的社区发现第三天上午第二章机器学习及数据挖掘常用技术4)回归算法a)线性回归b)Logistic回归c)岭回归d)Lasso回归5)回归的研究进展及趋势a)树回归b)支持向量回归locatedintheTomb,DongShenJiabang,deferthenextdayfocusedontheassa

4、ssination.Linping,Zhejiang,1ofwhichliquorwinemasters(WuzhensaidinformationisCarpenter),whogotAfewbayonets,duetomissedfatal,whennightcame第三天下午第二章机器学习及数据挖掘常用技术1)推荐算法a)基于内容的推荐b)基于协同的推荐2)推荐的研究进展及趋势a)社交化推荐locatedintheTomb,DongShenJiabang,deferthenextdayfocusedontheassassination.Linping,Zh

5、ejiang,1ofwhichliquorwinemasters(WuzhensaidinformationisCarpenter),whogotAfewbayonets,duetomissedfatal,whennightcame第四天上午第三章数据挖掘实战1大数据基础应用之分类问题:垃圾邮件过滤1)实验环境a)开发语言b)软件包2)问题定义a)目标b)可用数据c)预期输出3)算法分析a)贝叶斯方法回顾b)理论与应用结合c)算法应用过程4)数据预处理a)获取原始数据b)查看数据样本c)编写数据过滤程序d)获取训练样本与测试样本5)特征提取a)使用哪些特征?b)

6、使用什么类型的特征?c)编写特征提取程序6)模型训练a)一般过程b)训练与测试c)参数化模型选择d)关于overfitting模型实验e)回顾locatedintheTomb,DongShenJiabang,deferthenextdayfocusedontheassassination.Linping,Zhejiang,1ofwhichliquorwinemasters(WuzhensaidinformationisCarpenter),whogotAfewbayonets,duetomissedfatal,whennightcame第四天下午第三章数据挖掘实

7、战2大数据基础应用之回归问题:美国社区犯罪率预测1)实验环境2)问题定义a)目标b)可用数据c)预期输出3)算法分析a)回归方法回顾b)理论与应用结合c)算法应用过程4)数据预处理a)获取原始数据b)查看数据样本c)编写数据过滤程序d)获取训练样本与测试样本5)模型训练a)一般过程b)训练与测试c)参数化模型选择d)关于overfitting模型实验e)回顾第三章数据挖掘实战3分布式计算:大数据基础设施1)分布式环境简介a)分布式环境的基石b)ApacheHadoop生态环境2)分布式计算举例a)Mapreduce原理b)WordCount:基本案例c)Word

8、Median:WordC

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。