欢迎来到天天文库
浏览记录
ID:34104236
大小:3.61 MB
页数:68页
时间:2019-03-02
《基于结构连接的xml查询处理与研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、天津师范大学硕士学位论文基于结构连接的XML查询处理与研究姓名:贾蓓申请学位级别:硕士专业:计算机应用技术指导教师:包小源20080301摘要XML自从1998年由W3C提出以来,就迅速的成为Intemet上用于数据表示和数据交换的标准。XML文档大量涌现,XML的有效管理受到广泛关注。由于XML数据具有不同于传统数据形式的树状结构,使得传统的数据库技术不能有效地发挥作用,因此需要针对其特点研究新的处理方法。为了解决XML路径查询处理中的关键技术问题,为较大规模的XML查询应用提出切实可行的解决方案,
2、本文给出了XPath查询的系统框架,定义了系统可以处理的XPath的语法,实现了一个XML文档的查询处理系统。作为XML查询处理的核心操作,结构连接操作的高效实现是提高查询处理性能的关键所在。本文针对结构连接操作的高效问题,在XML数据区间编码的基础上,把基于过滤的小枝结构连接技术应用到查询系统中。把源路径以及路径包含的概念引入过滤算法,减少了PSet集合中的路径数目。对使用过滤算法与不使用过滤算法的整体小枝连接技术进行了实验比对,试验结果显示使用过滤算法的整体小枝连接具有更好的性能。现有的XML结构
3、连接算法都是在节点编码的基础上提出的。目前,各种节点编码方式及其对应的结构连接算法很多。本文针对多种结构连接算法进行了系统的总结和比较,并分析了各种算法的不同性能。关键字:XML,XPath,编码方法,过滤,结构连接AbstractXMLhasbecomenewcriteriaofdatarepresentionandexchangeinInternetandithasbeenacceptedinmanyfieldssinceitwasputforwardbyW3Cin1998.Thisiscreat
4、inganewsetofdatamanagementrequirementsinvolvingXML.Traditionaldatabasetechnologiescan’tworkefficientlyowingtothetree—likenatureofXMLdataandnewapplicationenvironment.NewtechnologiesspeciallydesignedforXMLdataareneededtoprocessXMLdataefficiently.Inthispap
5、er,wefocusonthepathexpressionprocessingsuchthatthekeyissuesinthelarge—scaleXMLqueryapplicationCanbesettledbyfeasibleapproaches.WeproposeasystemframeworkofXPathquery,definingtheXPathgrammarthatthesystemCandealwith,givingthequeryprocessingsystem.Asthecore
6、operationofXMLqueryprocessing,theefficientimplimenationofstructuraljoinisthekeytoimproveXMLqueryprocessing.BasedontheregionnumberingschemeofXMLdata'weledintofilter-basedtwigstructuraljointechnology.Differentformpreviousalgorithms,filterationalgorithmfil
7、tersthequerypatternandthedatasetwiththepathencodedinformation,leavingtheelementstojointhestructuraljoin.Thenweusetwigjoinalgorithmfortheseelements.Weintroducetheconceptofsourcepathandpathcontainment,decreasingtheamountofPSct.Wehavacarriedoutanexperiment
8、tocomparethetechnologysaboutwhetherusingfilteringalgorithmornot.Theresultsofourcomprehensiveexperimentshowthatthetwigjoinalgorithmwithfilteringprocessperformswellbothsyntheticandreal-worddatasets,andhasgoodscalability.TheXMLconta
此文档下载收益归作者所有