基于可扩展计算平台的大图数据管理-论文.pdf

基于可扩展计算平台的大图数据管理-论文.pdf

ID:53762480

大小:511.03 KB

页数:8页

时间:2020-04-24

基于可扩展计算平台的大图数据管理-论文.pdf_第1页
基于可扩展计算平台的大图数据管理-论文.pdf_第2页
基于可扩展计算平台的大图数据管理-论文.pdf_第3页
基于可扩展计算平台的大图数据管理-论文.pdf_第4页
基于可扩展计算平台的大图数据管理-论文.pdf_第5页
资源描述:

《基于可扩展计算平台的大图数据管理-论文.pdf》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、科研信息化技木与应用2013,4(1):49—56技术/TECHNOLOGY·基于可扩展计算平台的大图数据管理高军’一,杨冬青’21北京大学信息科学技术学院计算机科学技术系,北京1008712高可信软件技术教育部重点实验室,北京100871摘要:随着数据采集和存储技术的发展,社交网络、生物信息科学、交通导航等领域中出现了规模庞大、内部结构复杂、查询需求多样的大图数据。传统基于单机内存的图处理方法无法满足大图数据管理需求。可扩展计算平台的发展为大图数据管理提供了可行的技术方案。本文首先分析了大图数据之上的不同类型查询,

2、重点探讨了基于关系数据库、基于MapReduce计算框架、基于BSPfBulkSynchm.nousParalle1)计算模型和基于第三方外包服务器的大图数据管理方法,并分析了未来可能的研究路线关键词:大图数据:关系数据库:MapReduce;BSP;外包BigGraphManagementBasedonScalableComputingPlatformsGaoJun.YangDongqing,1.ComputerScienceDept..SchoolofElectronicsEngineeringandComput

3、erScience,PekingUniversity,Beijing100871,China2.KeyLaboratoryofHighConfidenceSoftwareTechnologies(PekingUniversity),MinistryofEducation,BeijingJ00871ChinaAbstract:Withthedevelopmentofdatacollectionandstoragetechniques,biggraphswithmassivesize,complexintra—relat

4、ionshipsanddifferentgraphqueries,appearinsocialnetwork,bio—informatics,andtransportationnetwork,etc.Theclassicgraphalgorithmswhicharesuitableinmemoryofasinglecomputercannotbeusedtobiggraphsdirectly.Theexplorationofexistingscalableplatformsprovidesfeasiblesoluti

5、onstomanagebiggraphs.Inthispaper,wefirstinvestigatedifferentkindsofgraph基金项目:国家高技术研究发展计划(863计划)(2012AA011002,2011AA010706);国家自然科学基金(61073018,61272156);深港创新圈项目(JSE201007160004A)49科研信息化技术与应用,2013,4(1)queries,andthenanalyzetheadvantagesanddisadvantagesofdifferenta

6、pproachestomanagementofbiggraphsusingvariousplatforms,includingrelationaldatabase,MapReduceframework,BSP(BulkSynchronousParalle1)modelandthirdpartyoutsourcedservers,andfinallyoutlinethefuturework.Keywords:Biggraph;Relationaldatabase;MapReduce;BSP;Outsourcing1引言

7、数据模型表达能力强,数据管理领域的研究人员就提出图模型为客观世界的数据进行建模,并设计了相关随着数据收集、数据存储等相关技术的发展,的原型系统。CharlesW.Bachman还由于其在图数据社交网络、生物信息科学、交通导航等领域出现了模型方面的贡献于1973年获得图灵奖。之后,由于大规模图数据。例如,社交网站Facebook于2004图数据查询表达和查询执行复杂度高,图数据管理系年开始创建,到20l1年已拥有8亿多活跃用户,统的研究趋缓。在这一阶段,关系数据库由于其操作用户可以在网站上发布消息,可以通过评论、增加接

8、口简单,查询优化技术实现突破,逐渐成为数据管好友等操作建立和其他用户的关联关系。在国内,理领域的主流。2000年后,随着社交网络等大图数中国移动通讯公司截止到2012年有6亿多用户,据的迅猛增长和大图数据应用需求的推动,图数据的用户之间通过呼叫关系等建立关联。这些数据规模相关研究工作重新成为热点。庞大,内部关联关系复杂,我们称此类数据为大图目前

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。