基于集成学习模型在店铺消费人数预测的应用研究

基于集成学习模型在店铺消费人数预测的应用研究

ID:20596278

大小:2.79 MB

页数:56页

时间:2018-10-14

基于集成学习模型在店铺消费人数预测的应用研究_第1页
基于集成学习模型在店铺消费人数预测的应用研究_第2页
基于集成学习模型在店铺消费人数预测的应用研究_第3页
基于集成学习模型在店铺消费人数预测的应用研究_第4页
基于集成学习模型在店铺消费人数预测的应用研究_第5页
资源描述:

《基于集成学习模型在店铺消费人数预测的应用研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、1学校代码:0270分类号:F224F832.4学号:162502928;上善砰说大爹硕士专业学位论文基于集成学习模型在店铺消费人数预测的应用研究学院:数理学院专业学位类别:应用统计专业领域:应用统计.研究生姓名:彭钰指导教师:张震完成日期:2018年5月上海师范大学硕士学位论文摘要论文题目:基于集成学习模型在店铺消费人数预测的应用研究学科专业:应用统计学位申请人:彭钰指导教师:张震摘要面对互联网技术应用的不断加深以及消费者支付方式的转变和多样化,对于线上的零售进行流量监控显得尤为重要,同时网络APP

2、积累了大量的用户和消费数据,如何将硕大的数据量转变为有商业价值的信息越来越受到人们的重视,对于店铺消费人数的预测可以为店铺优化运营、降低成本等。因此,针对店铺的消费人数的预测有着迫切的需求。本文在国内外研究的基础上,自行通过软件对运营平台搜集店铺的信息,通过简单的时间序列预测模型以及集成学习方法(随机森林、GBDT、XGBoost)进行建立模型,预测之后时间段的消费人数,并基于模型的预测效果好坏进行评估。实证部分采用了近60万条顾客的实际业务数据,通过对模型原理和实际业务背景的理解建立科学合理的特征工程框架,并进行数据的探索和可视化的实现。最后

3、得到的特征维度为275维,训练样本长度为469575来建立店铺消费人数预测模型。通过对比简单的时间序列预测模型和集成学习方法(随机森林、GBDT、XGBoost)的损失函数以及均方差得出模型的优势与不足之处,最后结果显示集成学习方法XGBoost在预测精度上优于GDBT、随机森林以及简单的时间序列预测模型,并在过拟合问题上具有良好的优势,但运行时间处于中等,综合较优。最后,从特征工程的重要性、参数的调整以及最后模型预测的精度对全文进行总结,并对本文的不足之处提出后续的研究建议。关键词:消费人数;预测;集成学习;XGBoost;特征工程论文类型:

4、实证分析I上海师范大学硕士学位论文AbstractAbstractWiththeapplyingofInternettechnologyandthediversificationofpaymentmethodsforconsumers,itisparticularlyimportanttomonitordataforonlineretail.Atthesametime,APPhasaccumulatedalargeamountofusersandconsumptiondata,andmoreandmoreattentionhasbeenpaid

5、tohowtotransformhugeamountsofdatatobeinformationswithcommercialvalue.Predictingthenumberofconsumersaboutstorescanoptimizeoperationsandreducecosts.Therefore,thereisanurgentneedforforecastingthenumberofconsumersaboutstores.Basedonresearchsathomeandabroad,thispapercollectedstor

6、es’informationthroughthesoftwareonitsownoperatingplatform.Throughsimpletimeseriesmodelandensemblelearningmethod(randomforest,GBDT,XGBoost)topredictthenumberofconsumersinthenextperiodandevaluatetheeffectofmodels.Theempiricalpartusesnearly600,000customers’dataofactualbusiness,

7、andestablishesscientificandrationalfeatureengineeringframeworkbyunderstandingthemodelprincipleandtheactualbusinessbackground.Besides,throughtheframeworkexploringandvisualizingdata.Theresultingfeaturedimensionis275dimensions,andthetrainingsamplelengthis469,575.Byusingthesefea

8、turestoestablishthestoreconsumptionforecastmodelsandbycomparinglossfunction

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。