第八讲_机器学习基础及机器学习库scikit-learn入门

第八讲_机器学习基础及机器学习库scikit-learn入门

ID:32344145

大小:1.85 MB

页数:37页

时间:2019-02-03

第八讲_机器学习基础及机器学习库scikit-learn入门 _第1页
第八讲_机器学习基础及机器学习库scikit-learn入门 _第2页
第八讲_机器学习基础及机器学习库scikit-learn入门 _第3页
第八讲_机器学习基础及机器学习库scikit-learn入门 _第4页
第八讲_机器学习基础及机器学习库scikit-learn入门 _第5页
资源描述:

《第八讲_机器学习基础及机器学习库scikit-learn入门 》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、法律声明本课件包括:演示文稿,示例,代码,题库,视频和声音等,小象学院拥有完全知识产权的权利;只限于善意学习者在本课程使用,不得在课程范围外向任何第三方散播。任何其他人或机构不得盗版、复制、仿造其中的创意,我们将保留一切通过法律手段追究违反者的权利。课程详情请咨询微信公众号:大数据分析挖掘新浪微博:ChinaHadoop互联网新技术在线教育领航者第八讲LOGO机器学习基础及机器学习库scikit-learn入门--梁斌互联网新技术在线教育领航者目录•什么是机器学习?•通过scikit-learn认识机器学习•sc

2、ikit-learn入门•特征降维—主成分分析•实战案例:识别Twitter用户性别互联网新技术在线教育领航者目录•什么是机器学习?•通过scikit-learn认识机器学习•scikit-learn入门•特征降维—主成分分析•实战案例:识别Twitter用户性别互联网新技术在线教育领航者什么是机器学习?人工智能vs机器学习vs深度学习互联网新技术在线教育领航者什么是机器学习?定义•MachineLearningisatypeofArtificialIntelligencethatprovidescomputerswit

3、htheabilitytolearnwithoutbeingexplicitlyprogrammed.•ProvidesvarioustechniquesthatcanlearnfromandmakepredictionsonDATA.互联网新技术在线教育领航者什么是机器学习?≈寻找一个函数•语音识别f()=“你好吗?”•图像识别f()=“猫”•围棋对战f()=“5-5”(下一步)•对话系统(如Siri)f(“你好!”)=“您好!”(用户发问)(系统回应)互联网新技术在线教育领航者什么是机器学习?如何选择?图像识别f()

4、=“猫”f()=“猫”f()=“猴子”12f1()=“狗”f2()=“蛇”互联网新技术在线教育领航者什么是机器学习?基本框架互联网新技术在线教育领航者什么是机器学习?基本步骤Step1.Step2:Step3:定义一系列函数定义函数的优劣选择最优的函数机器学习就是这么简单…互联网新技术在线教育领航者目录•什么是机器学习?•通过scikit-learn认识机器学习•scikit-learn入门•特征降维—主成分分析•实战案例:识别Twitter用户性别互联网新技术在线教育领航者什么是scikit-learn?互联网新技术在

5、线教育领航者什么是scikit-learn?互联网新技术在线教育领航者什么是scikit-learn?•面向Python的免费机器学习库•包含分类、回归、聚类算法,比如:SVM、随机森林、k-means等•包含降维、模型筛选、预处理等算法•支持NumPy和SciPy数据结构•用户http://scikit-learn.org/stable/testimonials/testimonials.html•安装•pipinstallscikit-learn•condainstallscikit-learn互联网新技术在线教育领

6、航者通过scikit-learn认识机器学习机器学习:问题描述•“学习”问题通常包括n个样本数据(训练样本),然后预测未知数据(测试样本)的属性•每个样本包含的多个属性(多维数据)被称作“特征”•分类:•监督学习,训练样本包含对应的“标签”,如识别问题•分类问题,样本标签属于两类或多类(离散)•回归问题,样本标签包括一个或多个连续变量(连续)•无监督学习,训练样本的属性不包含对应的“标签”,如聚类问题互联网新技术在线教育领航者通过scikit-learn认识机器学习机器学习:问题描述(续)•训练集vs验证集vs测试集互联

7、网新技术在线教育领航者通过scikit-learn认识机器学习scikit-learn上手•加载示例数据集•iris•digits•在训练集上训练模型•svm模型•.fit()训练模型•在测试集上测试模型•.predict()进行预测•保存模型•pickle.dumps()示例代码:01_scikit_ml.ipynb互联网新技术在线教育领航者目录•什么是机器学习?•通过scikit-learn认识机器学习•scikit-learn入门•特征降维—主成分分析•实战案例:识别Twitter用户性别互联网新技术在线教育领航者

8、scikit-learn入门使用scikit-learn的流程准备数据集选择模型训练模型测试模型调整参数•数据处理•根据任务选•根据经验设•预测•特征工程择模型定参数•识别•训练集、测•分类模型•交叉验证确•……试集分割•回归模型定最优参数•聚类模型•……互联网新技术在线教育领航者scikit-learn入门准备数据

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。