基于搜索数据的宏观指标预测方法研究

基于搜索数据的宏观指标预测方法研究

ID:35178350

大小:5.80 MB

页数:63页

时间:2019-03-20

基于搜索数据的宏观指标预测方法研究_第1页
基于搜索数据的宏观指标预测方法研究_第2页
基于搜索数据的宏观指标预测方法研究_第3页
基于搜索数据的宏观指标预测方法研究_第4页
基于搜索数据的宏观指标预测方法研究_第5页
资源描述:

《基于搜索数据的宏观指标预测方法研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、乂玉豬大葦D化IANUNIVERSITYOFTECHNOLOGY破±享恆巧文MASTE民ALDISSERTATION幽基于捜索数据的宏观指标预测方法研究软件工程学科专业作者姓名李侧指导教师连远竖2016年6月2曰答辩日期.-.,■?-.,1一'.V1;,-,硕dr学位论文基于捜索数据的宏观指标预测方法研究ResearchonMacroIndexPredka村onBasedonSearchDa化作者姓名:李光明学科、专业:

2、软件工程学号:21317018指导教师:李凤岐完成日期;20化年03月07日夫么巧义丈#DalianUniversityofTechnology大连理工大学学位论文独创性声明作者郑重声明:所呈交的学位论文,是本人在导师的指导下进行巧究工作所取得的成果。尽我所知,除文中已经注明引用内容和致谢的地方外,本论文不包含其他个人或集体己经发表的研究成果,也不包含其他己申请学位或其他用途使用过的成果一。与我同工作的同志对本研究所做的贡献均己在论文中做了明确的说明并表示了谢意。若有不实之处,本人

3、愿意承担相关法律责任。学位论文题目;基于搜索数据的宏观指标预测方法研究。6作者签名:日期;茄年/月7日大连理工大学硕±学位论文摘要移动互联网的飞速发展迎来了数据爆炸的时代,搜索服务提供商也因此积累了多样的海量用户搜索行为数据,这些数据是时下社会热点的间接反馈,与宏观指标的定义不一。谋而合因此,研究种基于搜索数据的宏观指标分析方法成为可能,而且具有重要的科研和实际价值。Google公司的OFT(GoogleF山Trends)模型利用Google搜索数据对世界范围内的流感预测做出的重要贡献,印

4、证了搜索行为数据巨大的潜在价值。百度作为国内最大-M的搜索服务提供商,记录着丰富的用户搜索行为数据,利用这些数据,本文提出BSIP(MacroIndexPredicationbasedonBaiduSearches)模型,对宏观指标进行全程自动化地预测分析,同时规避了(类)GFT模型对专业领域知识的强依赖约束。在早期的预测模型中,为避免因漏掉重要特征导致模型失准,通常会选择把可能相关的特征全部引入到-。GALasso(Genetic模型,但由此引入的特征冗余风险,可能导致模型失效本文提出W&Adaptive

5、Lasso)方法为核也的特征选择模块,将传统的特征选择方法与人工智能的思想相结合,提供了解决高维小样本问题和过拟合问题的实用方案。连续数值的离散化处理是数据预处理中的重要环节,不仅能够简化后续学习过程,提升学习效率。然而,无监督情境中的离散化问题,因缺少类标签信息的辅助,成为离散化处理中亟待解决的难题。本文结合聚类思想和集成学习的思想,提出了KED(KmeansbasedEnsemblingDiscretization)方法为核也的无监督的数据离散化处理模块,能高效地完成离散化任务。-MBSIP模型能够集成搜索数

6、据预测宏观指标,对相关领域的类似工作具有重要参A-asso考价值,L方法和KED方法则分别为其提供了可用性和可扩展性的保障而G,并且两个算法可W作为模块单独使用,具有较强的灵活性。关键词:搜索数据;宏观指标预测;特征选择;离散化--1基于搜索数据的宏观指标预测方法研巧ResearchonMacroIndexPredicationBasedonSearchDataAbstractTheraiddevelomentofmobileInternetusherstheeraofdat

7、aexlosionsearchserviceppp,providersthereforehaveaccumulatedvastamountsofsearchdata,whichreflectssocialhot,andcoincideswithmacroindexes.Suchthatstudinamethodbasedonsearchdatato,ygredictmacroindexesbecomesossibleanditwill巧larescientific

8、andracticalvalue.pp,ggp,TheGFTGooleFlueTrendsmodelbased

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。