欢迎来到天天文库
浏览记录
ID:34257916
大小:1.70 MB
页数:73页
时间:2019-03-04
《基于集成学习的空气质量预测模型分析研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、分类号:TP3910710-2015224017专业硕士学位论文基于集成学习的空气质量预测模型分析研究朱飞鸿导师姓名职称揣锦华教授专业学位类别申请学位级别工程硕士软件工程及领域名称论文提交日期2018年4月1日论文答辩日期2018年5月26日学位授予单位长安大学ResearchofAirQualityPredictionModelBasedonEnsembleLearningADissertationSubmittedfortheDegreeofMasterCandidate:ZhuFeihongSuperviso
2、r:Prof.ChuaiJinhuaChang’anUniversity,Xi’an,China摘要随着工业农业科技的发展,各个城市的空气质量逐渐开始影响着人们的日常生活和身心健康,改善空气质量成了当务之急,空气质量预测能够为空气质量的改善作出重要贡献。集成学习是一种非线性预测方法,它是机器学习的重要分支。Python是一种简洁可读性极好的编程语言,其丰富的机器学习库使得很多问题得以解决。本论文以西安市2013年至2017年的AQI日报数据为样本,在Python机器学习平台上实现了对空气质量的预测。论文主要工作内容
3、如下:论文首先对传统的空气质量预测方法进行了研究,介绍了机器学习和集成学习方法的理论知识,研究了常用的机器学习算法:多元线性回归算法、决策树算法、Bagging算法、随机森林算法和GBDT算法,并使用空气质量数据对算法进行实例分析。针对随机森林算法在不平衡数据预测分类上的不足,通过对随机森林中决策树的分类效果筛选对其进行优化,结果表明优化后的随机森林算法预测误差有所降低。对空气质量数据进行预处理,并对空气中各种污染气体的变化趋势进行可视化分析,对污染气体浓度的季节性变化进行分析,提出空气治理建议。进而根据集成学习方
4、法建立三个预测回归模型:基于Bagging算法的空气质量回归预测模型、基于随机森林算法的空气质量回归预测模型和基于GBDT算法的空气质量回归预测模型,分别使用这三种预测模型对空气质量进行预测,对预测误差及决策树规模关系进行分析与研究,并得出PM10是造成空气污染最严重的气体。通过调整三个预测模型的参数,得到每个模型的最优参数。通过对三个最优模型的预测均方误差进行比较,确定随机森林预测模型为最终预测模型。利用随机森林回归预测模型对西安市未来5天的空气质量进行预测,得到预期结果,并根据预测结果给出在该空气质量等级下是否
5、适合人们出行的建议。关键字:空气质量预测,集成学习,Bagging,随机森林,GBDTiAbstractWiththedevelopmentofindustrialagriculturalscienceandtechnology,theairqualityofeachcitygraduallybeginstoaffectpeople'sdailylifeandphysicalandmentalhealth.Theimprovementofairqualityhasbecomeanimperative,andairq
6、ualitypredictioncanmakeanimportantcontributiontotheimprovementofairquality.Ensemblelearningisanonlinearpredictionmethodanditisanimportantbranchofmachinelearning.Pythonisaconciselyreadableprogramminglanguage.Itsrichlibraryofmachinelearningallowsmanyproblemstobe
7、solved.ThisthesistakesXi’anAQIdailydatafrom2013to2017asasample,andrealizestheairqualitypredictiononthePythonmachinelearningplatform.Themainworkofthethesisisasfollows:Thepaperfirstlystudiesthetraditionalairqualitypredictionmethods,introducesthetheoreticalknowle
8、dgeofmachinelearningandensemblelearningmethods,andresearchesthecommonlyusedmachinelearningalgorithms:multiplelinearregressionalgorithm,decisiontreealgorithm,Baggingalgorithm,random
此文档下载收益归作者所有