Python数据挖掘与机器学习实战 - 选题.doc

Python数据挖掘与机器学习实战 - 选题.doc

ID:56907549

大小:49.50 KB

页数:4页

时间:2020-07-23

Python数据挖掘与机器学习实战 - 选题.doc_第1页
Python数据挖掘与机器学习实战 - 选题.doc_第2页
Python数据挖掘与机器学习实战 - 选题.doc_第3页
Python数据挖掘与机器学习实战 - 选题.doc_第4页
资源描述:

《Python数据挖掘与机器学习实战 - 选题.doc》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、Python数据挖掘与机器学习实战—选题大纲(一组一章,第一章除外)第一章:Python机器学习入学指南1.1、机器学习要解决的任务1.2、有监督与无监督问题1.3、线性回归算法原理推导1.4、Python语言基础1.5、Python数据结构(列表,字典,元组)1.6、科学计算库Numpy基础1.7、Numpy数组操作1.8、Numpy矩阵基本操作1.9、Numpy矩阵初始化与创建1.10、Numpy排序与索引第二章:逻辑回归与数据分析处理库Pandas2.1、Pandas数据读取与现实2.2、Pandas样本数值计算与排序2.3、Pandas数据预处理与透视表2.4、Pandas自定义

2、函数2.5、Pandas核心数据结构Series详解2.6、Pandas数据索引2.7、逻辑回归-sigmoid函数2.8、逻辑回归原理推导2.9、最优化问题2.10、实战梯度下降算法案例实战:(自己定)第三章:案例实战(自己定)3.1、数据与算法简介3.2、样本不平衡问题解决思路3.3、下采样解决方案3.4、正则化参数选择3.5、逻辑回归建模3.6、过采样与SMOTE算法3.7、Matplotlib绘制第一个折线图3.8、Matplotlib条形图,直方图,四分图绘制3.9、Matplotlib数据可视化分析第四章:决策树与随机森林4.1、熵原理,信息增益4.2、决策树构造原理推导4.

3、3、ID3,C4.5算法4.4、决策树剪枝策略4.5、随机森林算法原理4.6、基于随机森林的特征重要性选择案例实战:(自己定)第五章:Kaggle机器学习案例实战5.1、泰坦尼克船员获救预测(可自己定)5.2、使用pandas库进行数据读取与缺失值预处理5.3、使用scikit-learn库对比回归模型与随机森林模型5.4、GBDT构造原理5.5、特征的选择与重要性衡量指标5.6、机器学习中的级联模型5.7、使用级联模型再战泰坦尼克第六章:支持向量机算法6.1、SVM要解决的问题6.2、线性SVM原理推导6.3、SVM对偶问题与核变换6.4、soft支持向量机问题6.5、多类别分类问题解

4、决方案案例实战:SVM中参数对结果的影响(可自己定)第七章:神经网络模型7.1、前向传播与反向传播结构7.2、激活函数7.3、神经网络结构7.4、深入神经网络细节7.5、神经网络表现效果案例实战:神经网络处理图像分类任务(可自己定)第八章:mnist手写字体识别8.1、Tensorflow框架8.2、CNN网络结构8.3、构造CNN网络结构8.4、基于tensorflow的网络框架8.5、迭代优化训练第九章:经典案例实战9.1、鸢尾花数据集分析9.2、基于NLP的股价预测9.3、员工离职预测(根据自己情况确定)9.4、新闻分类任务9.5、词向量模型与LSTM情感分析第十章:聚类与集成算法

5、10.1、k-means,DBSCAN等经典聚类算法原理10.2、python实现k-means算法10.3、聚类算法应用场景与特征工程10.4、Adaboost集成算法原理案例实战:聚类算法可视化演示(可自己定)第十一章:其他机器学习算法11.1在线学习11.2迁移学习11.3增强学习11.4LSTM11.5GAN最新机器学习算法(可自己定)案例实战:(可自己定)或从下列选题中选择:(除第1讲)选题名称内容结构内容要求      第1讲机器学习与Python库(该讲不可选)解释器Python3.6与IDE:Anaconda/Pycharm1.Python基础:列表/元组/字典/类/文件

6、2.numpy/scipy/matplotlib/panda的介绍和典型使用3.多元高斯分布4.典型图像处理5.scikit-learn的介绍和典型使用6.多种数学曲线7.多项式拟合8.快速傅里叶变换FFT9.奇异值分解SVD10.Soble/Prewitt/Laplacian算子与卷积网络代码和案例实践1.卷积与(指数)移动平均线2.股票数据分析3.实际生产问题中算法和特征的关系4.缺失数据的处理5.环境数据异常检测和分析     第2讲回归 线性回归1.Logistic/Softmax回归2.广义线性回归3.L1/L2正则化4.Ridge与LASSO5.ElasticNet6.梯度下

7、降算法:BGD与SGD7.特征选择与过拟合8.Softmax回归的概念源头9.最大熵模型10.K-L散度代码和案例实践1.股票数据的特征提取和应用2.泰坦尼克号乘客缺失数据处理和存活率预测3.环境检测数据异常分析和预测4.模糊数据查询和数据校正方法5.PCA与鸢尾花数据分类6.二手车数据特征选择与算法模型比较7.广告投入与销售额回归分析8.鸢尾花数据集的分类  第3讲决策树和随机森林 熵、联合熵、条件熵、KL散度、互信息1.最大似然

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。