欢迎来到天天文库
浏览记录
ID:20596278
大小:2.79 MB
页数:56页
时间:2018-10-14
《基于集成学习模型在店铺消费人数预测的应用研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、1学校代码:0270分类号:F224F832.4学号:162502928;上善砰说大爹硕士专业学位论文基于集成学习模型在店铺消费人数预测的应用研究学院:数理学院专业学位类别:应用统计专业领域:应用统计.研究生姓名:彭钰指导教师:张震完成日期:2018年5月上海师范大学硕士学位论文摘要论文题目:基于集成学习模型在店铺消费人数预测的应用研究学科专业:应用统计学位申请人:彭钰指导教师:张震摘要面对互联网技术应用的不断加深以及消费者支付方式的转变和多样化,对于线上的零售进行流量监控显得尤为重要,同时网络APP
2、积累了大量的用户和消费数据,如何将硕大的数据量转变为有商业价值的信息越来越受到人们的重视,对于店铺消费人数的预测可以为店铺优化运营、降低成本等。因此,针对店铺的消费人数的预测有着迫切的需求。本文在国内外研究的基础上,自行通过软件对运营平台搜集店铺的信息,通过简单的时间序列预测模型以及集成学习方法(随机森林、GBDT、XGBoost)进行建立模型,预测之后时间段的消费人数,并基于模型的预测效果好坏进行评估。实证部分采用了近60万条顾客的实际业务数据,通过对模型原理和实际业务背景的理解建立科学合理的特征工程框架,并进行数据的探索和可视化的实现。最后
3、得到的特征维度为275维,训练样本长度为469575来建立店铺消费人数预测模型。通过对比简单的时间序列预测模型和集成学习方法(随机森林、GBDT、XGBoost)的损失函数以及均方差得出模型的优势与不足之处,最后结果显示集成学习方法XGBoost在预测精度上优于GDBT、随机森林以及简单的时间序列预测模型,并在过拟合问题上具有良好的优势,但运行时间处于中等,综合较优。最后,从特征工程的重要性、参数的调整以及最后模型预测的精度对全文进行总结,并对本文的不足之处提出后续的研究建议。关键词:消费人数;预测;集成学习;XGBoost;特征工程论文类型:
4、实证分析I上海师范大学硕士学位论文AbstractAbstractWiththeapplyingofInternettechnologyandthediversificationofpaymentmethodsforconsumers,itisparticularlyimportanttomonitordataforonlineretail.Atthesametime,APPhasaccumulatedalargeamountofusersandconsumptiondata,andmoreandmoreattentionhasbeenpaid
5、tohowtotransformhugeamountsofdatatobeinformationswithcommercialvalue.Predictingthenumberofconsumersaboutstorescanoptimizeoperationsandreducecosts.Therefore,thereisanurgentneedforforecastingthenumberofconsumersaboutstores.Basedonresearchsathomeandabroad,thispapercollectedstor
6、es’informationthroughthesoftwareonitsownoperatingplatform.Throughsimpletimeseriesmodelandensemblelearningmethod(randomforest,GBDT,XGBoost)topredictthenumberofconsumersinthenextperiodandevaluatetheeffectofmodels.Theempiricalpartusesnearly600,000customers’dataofactualbusiness,
7、andestablishesscientificandrationalfeatureengineeringframeworkbyunderstandingthemodelprincipleandtheactualbusinessbackground.Besides,throughtheframeworkexploringandvisualizingdata.Theresultingfeaturedimensionis275dimensions,andthetrainingsamplelengthis469,575.Byusingthesefea
8、turestoestablishthestoreconsumptionforecastmodelsandbycomparinglossfunction
此文档下载收益归作者所有