100天让你学会机器学习的项目!

100天让你学会机器学习的项目!

ID:21810106

大小:1.62 MB

页数:12页

时间:2018-10-24

100天让你学会机器学习的项目!_第1页
100天让你学会机器学习的项目!_第2页
100天让你学会机器学习的项目!_第3页
100天让你学会机器学习的项目!_第4页
100天让你学会机器学习的项目!_第5页
资源描述:

《100天让你学会机器学习的项目!》由会员上传分享,免费在线阅读,更多相关内容在应用文档-天天文库

1、100天让你学会机器学习的项目!  机器学习是我们这个时代最具变革性的技术,它具有从太空探索到财务,医学和科学的巨大应用。据估计,未来对机器学习专家的需求将会不断增加,今年估计增长约60%。  最重要的是,该行业在过去几年中经历了巨大的变革。以前,要成为一名机器学习专家,你需要有一个博士学位(或一些高学历),但现在已经不是这样了。由于大型科技公司如Alphabet(谷歌母公司),IBM,微软等公司的参与,现在任何人都可以更轻松地开始机器学习。  这不,YouTube上的大咖SirajRaval就发起了一

2、个挑战赛:#100DaysOfMLCode。  什么是#100DaysOfMLCode?  100天让你学会机器学习的项目!  机器学习是我们这个时代最具变革性的技术,它具有从太空探索到财务,医学和科学的巨大应用。据估计,未来对机器学习专家的需求将会不断增加,今年估计增长约60%。  最重要的是,该行业在过去几年中经历了巨大的变革。以前,要成为一名机器学习专家,你需要有一个博士学位(或一些高学历),但现在已经不是这样了。由于大型科技公司如Alphabet(谷歌母公司),IBM,微软等公司的参与,现在任何

3、人都可以更轻松地开始机器学习。  这不,YouTube上的大咖SirajRaval就发起了一个挑战赛:#100DaysOfMLCode。  什么是#100DaysOfMLCode?    这是向机器学习开发人员(专家或新手)发出的挑战,要求在接下来的100天内每天至少花一小时学习和构建机器学习模型。内容有易到难,由此也可以看得出博主Avik-Jain的用心良苦。  其中一名叫AvikJain的机器学习爱好者,创建了一个100-Days-Of-ML-Code的项目,很快引起了大家的注意,截至今日,该项目已

4、经获得了11570个「star」以及1993个「fork」(GitHub地址:https://github.com/Avik-Jain/100-Days-Of-ML-Code)。  更不可思议的是,他还创建了该项目的中文版  从他的GitHub主页可以看到他共创建了6个项目:    目前作者的100天计划,已经进行到第54天,已有的内容包括:  有监督学习  ●数据预处理  ●简单线性回归  ●多元线性回归  ●逻辑回归  ●k近邻法(k-NN)  ●支持向量机(SVM)  ●决策树  ●随机森林  无

5、监督学习  ●K-均值聚类  ●层次聚类  这里我们通过介绍第一天的数据预处理来深入了解下这个项目  数据预处理    第一步导入库  importnumpyasnpimportpandasaspd  第2步:导入数据集  dataset=pd.read_csv(‘Data.csv’)X=dataset.iloc[:,:-1].valuesY=dataset.iloc[:,3].values  第3步:处理丢失数据  fromsklearn.preprocessingimportImputerimput

6、er=Imputer(missing_values=“NaN”,strategy=“mean”,axis=0)imputer=imputer.fit(X[:,1:3])X[:,1:3]=imputer.transform(X[:,1:3])  第4步:解析分类数据  fromsklearn.preprocessingimportLabelEncoder,OneHotEncoderlabelencoder_X=LabelEncoder()X[:,0]=labelencoder_X.fit_transfor

7、m(X[:,0])  创建虚拟变量  onehotencoder=OneHotEncoder(categorical_features=[0])X=onehotencoder.fit_transform(X).toarray()labelencoder_Y=LabelEncoder()Y=labelencoder_Y.fit_transform(Y)  第5步:拆分数据集为训练集合和测试集合  fromsklearn.cross_validationimporttrain_test_splitX_tra

8、in,X_test,Y_train,Y_test=train_test_split(X,Y,test_size=0.2,random_state=0)  第6步:特征量化  fromsklearn.preprocessingimportStandardScalersc_X=StandardScaler()X_train=sc_X.fit_transform(X_train)X_test=sc_X.fit_transform(X_test) 

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。