分布式数据库查询处理和优化算法的研究

分布式数据库查询处理和优化算法的研究

ID:34108424

大小:2.69 MB

页数:68页

时间:2019-03-03

分布式数据库查询处理和优化算法的研究_第1页
分布式数据库查询处理和优化算法的研究_第2页
分布式数据库查询处理和优化算法的研究_第3页
分布式数据库查询处理和优化算法的研究_第4页
分布式数据库查询处理和优化算法的研究_第5页
资源描述:

《分布式数据库查询处理和优化算法的研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、重庆大学硕士学位论文中文摘要摘要分布式数据库系统是数据库系统与计算机网络相结合的产物,它主要研究在计算机网络上如何进行数据的分布和处理。对于查询操作,若是在分布式环境中,由于查询涉及的关系通常被分片或复制在多个站点中,所以计算代价时不仅要考虑CPU和I/O的速度,还要考虑数据在站点间通信时产生的网络传输代价。由于查询中的连接操作需要的通信代价较高,所以,为了使分布式数据库能更有效地处理连接,国内外学者一直在进行这方面的研究,形成了各种不同的算法。其中,广泛使用的一种方法就是基于哈希划分的连接优化算法。经过哈希划分后的每一个关系根据哈希函数值被划分到不同的片

2、段,并存储在不同的站点中。不同关系通过相同的HASH划分后,在连接时将保持站点依赖。但是,当多个关系连接时,一般又都存在着重哈希划分问题。重哈希划分将大大地增加站点间的通讯代价。虽然前人也提出了一些代价模型和算法,以减少重哈希划分次数,但这些算法要么存在局限性,要么在查询规模变大时得不出满意的优化结果。本论文通过阅读大量文献,首先描述了各种分布式数据库的连接算法,然后对基于哈希划分的分布式连接算法进行了详细讨论,特别是对CHAIN算法和Kruskal启发式算法进行了较深入的分析和研究,并在此基础上引入了一种基于查询图分割的启发式哈希划分连接算法。该算法将查

3、询图分割成若干查询块,然后对相应查询块分别进行优化,以获得较好的优化结果。它的主要特点为:①分别引入了边界点和查询块的概念;②在对查询图进行分割时,引入了判断边界点的两个准则;③算法中所有连接操作的费用都是以基于哈希划分的代价模型来计算的;④整个算法运用了回溯的思想;⑤算法应用了Kruskal启发式算法和CHAIN算法对相应查询块进行优化;⑥利用算法得出的优化结果,连接操作可在站点间并行执行。该算法对查询图进行深度优先搜索,产生各个边界点及相应的查询块。然后利用Kruskal启发式算法对特定的查询块进行优化。当一轮遍历结束后,算法将重新构造一个新的查询图,

4、接着对该查询图以深度优先搜索,重复以上各步操作,直到查询图不能再分割为止。论文最后对本算法进行了实验验证,实验结果表明使用该算法产生的关系连接序列花费的代价比传统的Kruskal启发式算法更小。关键词:分布式数据库,查询优化,等值连接,哈希划分,代价公式,查询图,冗余条件表达式,边界点,查询块I重庆大学硕士学位论文英文摘要ABSTRACTDistributeddatabasesystemisanewtechnologyasaresultofwhichcomputernetworkisincorporatedintodatabasesystem.Theres

5、earchondistributeddatabasesystemismainlyfocusedonhowtoallocatedatafragmentsandprocessthemjustviaanetwork.Withregardtoqueryprocessing,ifinadistributeddatabasemanagementenvironment,therelationsinvolvedinadistributedquerymaybefragmentedand/orreplicated,therebytheoverheadcostisnotonly

6、expressedasaweightedcombinationofI/OandCPU,butalsoincludingcommunicationcosts.Sincethecriticalcostfactorsarerelatedtotheexecutionofjoinsreqiredinadistributedquery,researchersbothdomesticandoverseashavebeendoingresearchonoptimizationofrelationjoinsandsodesignedvariouskindsofmethods

7、.Andofallthesemethods,onemethodoptimizesequijoinqueriesindiatributeddatabasewhererelationsarehorizontallypartitionedusingahashfunctionandhasbeenwidelyappliednow.Accordingtoavalueofhashfunction,everyrelationisdividedintodistinctedhorizontalfragmentationafteroncehashpartitionedonita

8、ndstoredinmanydifferentsites.Thus

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。