基于HBase的RDF存储系统的研究与设计.pdf

基于HBase的RDF存储系统的研究与设计.pdf

ID:52405641

大小:2.04 MB

页数:64页

时间:2020-03-27

基于HBase的RDF存储系统的研究与设计.pdf_第1页
基于HBase的RDF存储系统的研究与设计.pdf_第2页
基于HBase的RDF存储系统的研究与设计.pdf_第3页
基于HBase的RDF存储系统的研究与设计.pdf_第4页
基于HBase的RDF存储系统的研究与设计.pdf_第5页
资源描述:

《基于HBase的RDF存储系统的研究与设计.pdf》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库

1、ADisertationSubmitedtoZhejiangUniversityfortheDegreeofUnlVerS1tytortneUegree0tMasterofEngineering⑧T工TLE:基金§皇垒!鱼h垒旦鱼旦皇兰至g垒Q£垦旦EStorageSystembasedonHBase3tOrageSVStembaSed0nHBaSeAuthor:,、3UDerVlSOr:Subject:College:SubmittedDate:。I垒卫:2Q!!浙江大学硕士学位论文Ⅲ删㈨⋯删1111l洲㈨⋯洲Y1853113摘要随着语义W曲的发展,资

2、源描述框架(ImF)得到了广泛的应用。然而传统集中式的RDF存储系统在日益增长的数据面前遭遇了难以跨越的存储与查询瓶颈。研究人员开始将目光投向分布式领域,以期利用分布式系统所具备的海量存储与并行计算能力来解决当前集中式ImF存储系统面临的各项问题。本文以ImF存储系统为研究对象,提出了采用分布式存储系统HBase存储ImF数据的方案,以及应用M印Reduce并行计算框架进行I①F查询处理的策略。首先,本文介绍了RDF存储系统的研究现状。本文介绍了ImF的概念背景、RDF标准查询语言SPARQL的构成,简述了当前已有的部分分布式RDF存储系统实现以及当前基

3、于Hadoop相关技术的RDF存储研究现状。接着,在深入分析ImF存储系统的各项特性后,本文提出采用分布式存储系统HBaSe来存储I①F数据的具体方案。RDF数据将被存储在SP0、POS、OSP三张表中。本文描述的方案充分利用了HBaSe的默认索引机制,在保证RDF查询性能的同时有效地减少了ImF数据的存储开销。然后,本文提出采用MapReduce并行计算框架处理SPARQL查询语言中BasicGraphPattem(BGP)的具体策略。本文在当前己有的MapReduce多路连接方法之上提出了一个贪心的多路连接选择策略。本文提出在进行M即Reduce多路

4、连接时优先处理具备高选择性的HplePattem子句,这样就可以在Map阶段提前过滤冗余数据,从而在保证MapReduce任务数目一定的情况下尽可能减少整个连接处理过程中的I/O操作开销。本文采用LUBM测试集对查询策略进行了实验,实验结果表明了本文提出的查询策略在大数据集下可以有效工作。最后,本文以HBase上的RDF存储方案与MapReduce连接处理策略为基础搭建了基于HBaSe的RDF存储系统原型。关键词:资源描述框架,分布式系统,HB2Lse,M印Reduce并行计算框架浙江大学硕士学位论文AbstractSincether印iddeVelop

5、mentofsemantic、ⅣebtecllIlologies,ResourceDescriptionFrameworkiswidelyusednowadays.However,thetraditionalcemralizedRDFstoreshaVelimitationsinIlaIldlinghugeImFdatasets.T.0resolVetheproblem,distributeda11dparallelsystemarenowbeiIltroducingimoImFstoragesystem.Inmispaper,、Ⅳeresearched

6、onRDFstoragesyStema11dproposedusingHBaSe,w11ichisadistributedcohulln—orienteddatabase,tostoreRDFdatasetsandusingMapReducetoaJls、)~,erImFqueries.First,weintroducedthebackgroulldknowledgeofmodemRDFstoragesystem,includingtheconceptofImFa11ds伽1(1ardRDFque巧languageSPARQL.Wet}lengaVean

7、oVeⅣiewofexistingdis伍butedImFStoragesystemaIldt11ecu玎entresearchesonintegratingRDFstorewithHadooprelatedtechnologies.Then,witllade印a11alyticalunderstalldingofI①FStoragesystem,weproposeda11印proachtouseHBasetostoreImFd北lSet.ImFtriples谢llbestoredinthI。eeHBasetables,Ⅵ,hichareSPO、POSa

8、ndOSP.0ur印proachmal(esmlluSeoftlledefjal

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。