基于大数据的景区客流量预测系统设计

基于大数据的景区客流量预测系统设计

ID:19654198

大小:70.00 KB

页数:6页

时间:2018-10-04

基于大数据的景区客流量预测系统设计_第1页
基于大数据的景区客流量预测系统设计_第2页
基于大数据的景区客流量预测系统设计_第3页
基于大数据的景区客流量预测系统设计_第4页
基于大数据的景区客流量预测系统设计_第5页
资源描述:

《基于大数据的景区客流量预测系统设计》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、基于大数据的景区客流量预测系统设计[摘要]通过采集和挖掘互联网大数据,以舟山普陀山景区为例,研究网络关键词搜索量、网上酒店预订率、网络气象预报等大数据与景区旅游客流量的数据相关性。采用Lasso回归算法构建预测模型,并提出基于大数据的景区客流量预测系统设计。本文采集自网络,本站发布的论文均是优质论文,供学习和研究使用,文中立场与本网站无关,版权和著作权归原作者所有,如有不愿意被转载的情况,请通知我们删除匕转载的信息,如果需要分享,请保留本段说明。[关键词]大数据;客流量预测;Lasso回归;数据挖掘[D0I]1013939/jcnkizgsc

2、201716322随着国内旅游需求的不断提升,快速有效地预测旅游景区客流量已经成为提高旅游景区服务品质和建设智慧旅游景区的熏要课题。传统的旅游客流量预测主要是基于静态的历史数据进行预测分析,通常会忽视或者不能及时反映一些重要因素对客流量的影响,如天气变化、互联M热点。而借助互联网大数据技术可以通过实时数据采集、跟踪研究目标景区游客在互联网上产生的大景行为数据,进行挖掘分析,使得在实际景区客流量预测应用中具存动态响应及时等优越性。本文以舟山普陀山景区为例研宄基于互联网大数据的景区客流量短期动态预测及其系统设计。1景区客流量有关大数据分析11景区

3、客流量数据探索分析本文以普陀山景区为例对影响客流量因素进行大数据分析,首先对互联网大数据按照是否适合计算机自动采集进行抽取,将抽取的数据作为基础数据来源;其次再根据舟山景区的特点筛选相关性强的因素。初步选取以下因素作为自变量,包括天气因素:气温(XI)、风力(x2);OTA酒店预订率(x3);关键词搜索指数(x4);节假日因素(x5):包括一般节假日和特定宗教节日;经济因素:经济景气指数(x6)、消费者信心指数(x7)等,分析它们与景区客流量(y)之间的关系。根据以上选定因素对舟山普陀山景区2015-2016年数据进行描述性统计分析,获得主要

4、变量数据的统计描述如表1所示。在描述性统计分析了解数据的整体情况后,然后进行相关分析,通过Pearson相关系数初步判断应变量与自变量之间的线性相关程度。其中,经济因素:经济景气指数(x6)、消费者信心指数(x7)与景区客流量(y)之间线性相关不明显,而且变化幅度很小。因此,筛去经济景气指数(x6)、消费者信心指数(x7)两个变量。12模型构建在以上数据分析的基础上,建立回归预测模型,算法上主要采用Lasso回归方法,Lasso方法较传统的最小二乘法等更利于参数估计和变量选择。Lasso回归优化问题可以表示为:2景区客流量预测系统设计方案21

5、预测系统框架与流程景区客流量预测系统由网络数据采集子系统、数据库存储与处理子系统和预测输出子系统等组成。其中,网络数据采集子系统负责自动化采集互联网相关大数据;数据库存储与处理子系统负责将网络数据采集子系统收集的互联网相关大数据进行规范化并存储处理;预测输出子系统负责将数据库存储与处理子系统处理好的数据应用回归预测模型计算并按照需要的方式输出结果。整个景区客流量预测系统的基本框架与流程如下图所示。景区客流量预测系统流程上图中系统主要流程可以分为:(1)数据导入:从互联网大数据中初步选取预测模型所需数据,然后导入预测系统数据输入接口。(2)数据

6、预处理:将导入的数据统一处理成规范化格式,以便数据库存储及预测模型处理。(3)机器学习:将预处理的数据进行挖掘、分析对冋归预测模型参数进行验证和调整。(4)多元回归预测:根据回归预测模型计算未来若干期的景区客流量预测数据。(5)预测输出:将预测模型计算结果通过需要的方式如可视化等进行输出22预测系统功能设计系统主要核心功能包括互联网数据采集、数据处理及存储、自适应的预测输出三部分功能。其中,互联网数据采集功能的实现主要通过两类途径:一是通过互联网络大数据平台,如百度、APIStore等提供的互联网大数据AH接口,主要采集的相关数据格式为JS0

7、N。例如,天气预报、节假H、搜索指数等。二是对互联网特定相关网站网页进行抓取通过D0M分析取得对应数据。例如,0TA酒店预定、景区等数据则采用HTMLParser等网页分析工具实现对指定网页相关数据抓取。数据预处理及存储功能主要采用PDO+TinyDB+Rserve组合。其中,PDO是访问数据库的一个轻量级的、一致性的接口,它提供了一个数据访问抽象层。TinyDB是一种适合存储JSON格式的轻量级面向文件的数据库。Rserve是R语言与其他语言如Java/PHP/Python等进行通信的服务程序,支持基于TCP/IP的远程连接,支持远程执行R

8、脚本。预测模块功能设计采用以adaptiveLASSO回?w为基础的自适应算法。首先根据adaptiveLASSO算法先确定一组回归系数,然后通过这组回归系数进行叠

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。