基于hbase的海量气象结构化数据查询优化

基于hbase的海量气象结构化数据查询优化

ID:35057030

大小:6.68 MB

页数:66页

时间:2019-03-17

基于hbase的海量气象结构化数据查询优化_第1页
基于hbase的海量气象结构化数据查询优化_第2页
基于hbase的海量气象结构化数据查询优化_第3页
基于hbase的海量气象结构化数据查询优化_第4页
基于hbase的海量气象结构化数据查询优化_第5页
资源描述:

《基于hbase的海量气象结构化数据查询优化》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、■;10300TP392单位代码分类号:可.一.145594学号:201312密级;iiiU金立化采專硕±学位论文a、一"雜基于HBase的海量气象结构化数据查询优化OtmizationofmassivemeteoroloicalstructureddatapiguerbasedonHBaseqy申请人姓名:徐熙超指导教师:马廷淮教授专业《椒软件工程研究方向:数据共享存储所在学院:计貧机与软件学院二—六年六月〇…'’I-'''…-'■、’:.V.-'?>々

2、,.,.独创性声明本人声明所呈交的论文是我个人在导师指导下进行的研究工作及取得的研究成果。本论文除了文中特别加W标注和致谢的内容外,不包含其他人或其他机构已经发表或撰写过的研究成果,也不包含为获得南京信息工程大学或其他教育机构的学位或证书而使用过的材料。其他同志对本研巧所做的贡献均百在论文中作了声明并表示谢意。.‘矣.备方学位论文作者签名、:遙接_签字曰期為关于论文使用授权的说明南京信息工程大学、国家图书馆、中国学术期刊(光盘版)杂志社、中国科学技术信息研巧所的《中国学位论文全文数据库》有权保留本人所送交学位论文的复印件和电子文档,可W采

3、用影印、缩印或其他复制手段保存论文,并通一过网络向社会提供信息服务。本人电子文档的内容和纸质论文的内容相致。除在保密期内的保密论文外,,允许论文被查阅和借阅可W公布(包括刊登)论文的全部或部分内容。论文的公布(包括刊登)授权南京信息工程大学研究生院办理。\Z^1开□保密(年月)保密的学位论文在解密后应遵守此^__(1;协议)务扛学位论文作者签名:合签字日期:辛>1会指导教师签名:签字曰期=>\7目录摘要IIIABSTRACTIV一第章引言111.1研巧背景和意义1.2研究现状213研究内容51.4论文结

4、构6第二章HBase存储结构队及协处理器机制72.1分布式存储系统HBase727.1.1甜犯e的数据模型2丄2HBase的系统架构82丄3HBase的数据操作92丄4HBase区域数据块拆分策略102丄5拆分策略的优缺点112.2协处理器机制122.3本章小结13第H章基于负载量的区域数据块拆分策略153.1区域数据块的拆分流程15317.2基于负载量的区域数据块拆分模型3.2.1确定节点评价指标173.2.2确定评价函数193.2.3评价函数较向量建模与计算19323.3基

5、于负载量的区域数据块拆分模型的实现3.4本章小结26第四章基于协处理器的索引模型274.1基于协处理器的索引模型概述27428.2表结构设计4.3索引模块294.3.1索引建立314.3.2索引删除:.324.3.3索引查询33I4.3.4索引同步344.4本章小结%第五章实验平台与测试375.1实验平台搭建375.1.1实验环境375丄2环境配置385.2实验工具395.2.1数据导入工具KetleSpoon3951.2.2系统监控工具Ganga4li5.2.3压力测试工具

6、YCSB425.3基于负载量的区域数据块拆分策略实验425.3.1实验设计42543.3.2实验结果5.4基于协处理器的索引模型实验465.4.1实验设计46542实验结果47..5.5本章小结50第六章总结与展望5261.工作总结526.2研究展望53参考文献54致谢59作者简介60II摘要海量气象观探测数据是提高公共气象服务精细化、精准化和个性化水平的关键,日增TB级的气象数据在存储、检索及共享方面的时效性要求对构建在传统IOE技术架构上的气象数据管理系统提出了严峻挑战。因此W数据共享

7、为导向的气象数据共享平台成为了研究的热点,它旨在通过分布式架构W及可线性扩容能为来处理海量气象数据,所W整个数据平台负载的平衡W及对数据查询的低延时是保证各个气象服务高效使用气象数据的关键。本文主要研巧HBase分布式非关系型数据库(HadooDataBase)的区p域数据块拆分策略与索引模型,针对HBase在数据导入阶段W及数据查询阶段的不一足,提出了种更有效的方案。具体内容及成果如下:(1

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。