浅析分布式数据库查询优化.doc

浅析分布式数据库查询优化.doc

ID:56759981

大小:68.50 KB

页数:4页

时间:2020-07-07

浅析分布式数据库查询优化.doc_第1页
浅析分布式数据库查询优化.doc_第2页
浅析分布式数据库查询优化.doc_第3页
浅析分布式数据库查询优化.doc_第4页
资源描述:

《浅析分布式数据库查询优化.doc》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、分布式数据库查询优化【摘要】本文针对分布式数据库查询优化进行了分析与探讨,讲述了其特点,与原理供相关计算机方面人员参考。【关键字】分布式、数据、查询、优化一、分布式数据库及其特点:分布式数据库系统是物理学上分散而逻辑上集中的数据库系统。分布式数据库系统使用计算机网络将地理位置分散而管理和控制又需要不同程度集中的多个逻辑单位连接起来,共同组成一个统一大业的数据库系统。因此,分布式数据库系统可以看成是计算机网络与数据库系统的有机结合。一个分布式数据库系统应该具有如下特点:数据的物理分布性、数据的逻辑整体性、站点自治性二、分布式数据库查询基本概念1.分布式数据库查询优化的研

2、究意义:分布式查询技术主要把用户提交的全局查询请求翻译为几个相关节点都可以识别的本地查询请求,以及把各个节点的查询结果汇总返回的问题,它包括分布式查询处理和分布式查询优化。分布式查询处理研究整个分布式查询处理的过程和策略;分布式查询优化研究查询策略的优化问题,即如何从多种方案中选择查询代价最少方案。分布式查询处理作为分布式数据库研究主要问题之一,它是用户与分布式数据库之间的接口,在分布式数据库中由于数据的分布与冗余,使得数据在各站点间的传输代价成为查询处理的主要矛盾;另一方面,数据的分布与冗余也增加了查询的并发处理的可能性,从而可以缩短查询处理的响应时间,提高处理速度

3、。因此,与集中式数据库相比,分布式查询处理增加了不少新内容与复杂性。2.分布式查询处理的层次结构:分布式查询处理按不同的层次执行,符合分布式数据库系统的层次结构。分布式查询处理可分为如下所示四个层次结构。(1)查询分解查询分解是将查询问题(如SQL语句)转换成一个定义在全局关系上的关系代数表达式。这一层的做法与集中式DBMS相同,因为并未涉及分布问题。本层转换所需要信息在全局概念模式中得到。(2)数据本地化数据本地化是把一个在全局关系上的查询进行具体化到合适片段上的查询。这一变换所需要信息在分片模式和片段的分配模式中获得。(3)全局优化全局优化输入是分片查询,全局优化

4、是找出分片查询的最佳操作次序,包括使得代价函数最小。全局优化一个重要方面是关于连接操作的优化,全局优化处理层输出是一个优化的、片段上的关系代数查询。这层转换所需要信息来自数据库的统计信息,包括各站点片段统计信息、资源信息和通信信息等。(4)局部优化局部优化由与查询有关片段的各个站点执行。它由该站点上的DBMS进行优化,采用集中式数据库系统中查询优化的算法,所需要信息来自于局部模式。分布式查询优化通常在分布式查询层次结构中的数据本地化层和全局优化层。数据本地化阶段一般采用的是基于关系代数等价变换的优化算法。而全局优化阶段采用的算法,可具体分为基于半连接算法的查询优化和基

5、于直接连接算法的查询优化两大类。1.分布式数据库数据库查询优化的一般过程:分布式查询处理问题是由E-Wong首先提出的,分布式查询处理的基本思想认为分布式查询处理是数据传递和局部处理相交织的过程,分布式查询处理策略由数据传递策略与局部处理策略组成;分布式查询处理的过程实质是利用数据传递策略和局部数据处理策略,把分布查询转化为局部查询的过程。分布式数据库中的查询过程可分为逻辑分解、评议转换和优化组合几分。分布式数据库系统中,用户可以用全局查询评议对多个数据库同时进行查询,即为全局查询。全局查询一般经过以下几个过程:首先,对全局查询进行逻辑分解成几个子查询,每个子查询对应

6、一个局部数据;其次,若全局查询评议与局部查询评议不同,则进行语言的等价转换;最后,各个子查询的结果优化组合后返回。不同的查询分解对应不同的系统性能,因此为了达到优化系统性能,需要相应查询优化器来确定一个相对较好的执行计划,最后启动查询计划。2.分布式数据库查询优化的衡量标准:一个查询策略的选择是以执行查询的预期代价为依据的,由集中式系统大都运行在单个处理器的计算机上,所以查询执行总代价为CPU代价加I/O代价之外。分布式查询优化可用CPU代价、I/O代价、通信代价3个参数来徇,总代价为三者之和。在分布式数据库系统中,常以两种不同的目标来考虑查询优化:1.以总代价最小为

7、标准,除了CPU代价和I/O代价之外,还包括数据通过网络传输的代价。2.以每个查询的响应时间最短为标准。响应时间就是从接收查询到完成查询所需要的时间。它既与通信时间有关,又与局部处理时间有关,而通信费用与所传输的数据量和通信次数成正比。3.分布式数据的查询优化策略:一般来说,在分布式数据库中的查询优化主要考虑以下几种:1.操作执行的顺序:操作执行顺序的改变主要指关系运算及集合运算的改变,它们常常对铁性能产生重要的影响。2.关系的存取方法:在关系数据库系统中,关系或使用索引,如果关系中90%的要被访问,则扫描整个关系是较好的;如果只有30%的被访问,则

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。