欢迎来到天天文库
浏览记录
ID:31972899
大小:1.93 MB
页数:73页
时间:2019-01-29
《分布式数据库的查询优化算法研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、分布式数据库的查询优化算法研究摘要本文首先介绍了分布式数据库系统的基本概念,如分布式数据库系统的模式结构及体系结构、数据分片的原则及分类、数据分布的策略等;然后简要描述了分布式查询的处理过程:接着本文重点研究了分布式查询的一些常用优化算法,如基于关系代数等价变换规则的优化算法、基于连接的优化算法、基于半连接的优化算法、SDD1算法,基于查询图的贪婪算法。本文在对分布式查询的一些常用优化算法研究的基础上,设计了一个新的算法,本文称之为基于多关系半连接查询优化算法,以适用于以分布式数据库系统的缓冲区作为查询的中间结果的最后装配站点这种情况。实验证明基于多
2、关系半连接的查询优化算法明显地减少了中间结果数据量,有效地降低了网络通信总代价。关键字:分布式数据库,查询优化,SDD1,多关系半连接ResearchonQueryOptimizationAlgorithmofDistributedDataBaseAbstractThispaperintroducesthebasicconceptofdistributeddatabasesystem,suchasthemodearchitectureandsystemarchitectureofDDBS,theprincipleandclassificationof
3、datafragmentation,thestrategyofdatadistribution.Thispaperdescribesthemanagementprocessingofdistributedquery.Thispapergiveemphasistotheresearchontheregularoptimizationalgorithmsofdistributedquery,suchastheoptimizationalgorithmbasedontheregulationofrelationalgebraequivalencetrans
4、formation,theoptimizationalgorithmbasedonjoin,theoptimizationalgorithmbasedonsemijoin,SDD_1algorithm,thegreedyalgorithmbasedonquerygraph.OnthebasisoftheresearchontheSDD_1algorithmandthegreedyalgorithmbasedonquerygraph,thispaperdesignanewalgorithmnamedthequeryoptimizationalgorit
5、hmbasedonmultiplerelationssemijoin,whichintegratethecharacteristicsofSDD_1algorithmandthegreedyalgorithmbasedonquerygraph,thisnewalgorithmcanbeappliedtothecircumstanceinwhichthecacheofDDBSisthefinalassemblysiteoftemporaryqueryresult.Thealgorithmreducethetemporaryresultdatanumer
6、distinctlyandreducethenetworkcommunicationtotalcosteficientlythroughexperiment.Keywords:distributeddatabase,queryoptimization,SDD_l,multiplerelationssemiloin上海师范大学硕士学位论文分布式数据库的查询优化算法研究h在--p}己!-1-只7-F‘J.「】1.1论文背景分布式数据库系统是计算机网络技术与数据库技术互相渗透和有机结合的产物。具有数据独立性、集中与自制相结合的控制机制、适当增加数据冗余、事
7、务管理的分布性等特点。在分布式数据库系统中,数据独立性除了数据的逻辑独立性与物理独立性外,还有数据分布独立性亦称分布透明性。分布透明性指用户不必关心数据的逻辑分片,不必关心数据物理位置分布的细节,也不必关心重复副本的一致性问题,同时也不必关心局部场地上数据库支持哪种数据模型。有了分布透明性,用户的查询程序书写起来就如同数据没有分布一样,使系统使用起来更简单、有效。在集中式数据库系统中,为减少空间的浪费和保证数据的一致性,要尽量减少数据的冗余。而分布式数据库系统却希望增加数据的冗余来提高系统的可靠性、可用性和改善系统性能。但是由于数据的分布和冗余,使得
8、分布式数据库系统查询处理增加了许多新的内容和复杂性,因此分布式查询处理的优化显得更为重要。无论是在集中式数据
此文档下载收益归作者所有