试析基于xml的异构数据集成研究

试析基于xml的异构数据集成研究

ID:35123136

大小:2.11 MB

页数:59页

时间:2019-03-19

试析基于xml的异构数据集成研究_第1页
试析基于xml的异构数据集成研究_第2页
试析基于xml的异构数据集成研究_第3页
试析基于xml的异构数据集成研究_第4页
试析基于xml的异构数据集成研究_第5页
资源描述:

《试析基于xml的异构数据集成研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、基于XML的异构数据集成研究重庆大学硕士学位论文学生姓名:张晓剑指导教师:罗军副教授专业:计算机系统结构学科门类:工学重庆大学计算机学院二OO八年四月HeterogeneousDataIntegrationStudyBasedOnXMLAThesisSubmittedtoChongqingUniversityinPartialFulfillmentoftheRequirementfortheDegreeofMasterofComputerbyZhangXiaojianSupervisor:AssociateProf.LuoJunMa

2、jor:ComputerSystemArchitectureCollegeofComputerScienceofChongqingUniversity,Chongqing,ChinaApril,2008重大大学硕士学位论文中文摘要摘要随着计算机网络的飞速发展和信息化建设的大力推进,各种网络中可供利用的信息总量正以惊人的速率增长。但这些为不同应用服务的信息都存储在许多不同的数据源之中,其数据内容、数据格式和数据质量千差万别,且其管理系统也各不相同。为更有效地利用这些信息,需要对多个分布、异构和自治的数据源中的信息进行集成,向用户隐藏这

3、些差异,提供给用户一个统一和透明的数据访问接口,同时还需要保持数据在不同系统上的完整性和一致性。因此,在信息集成过程中,如何有效解决这些差异是信息集成研究与应用领域所面临的一大挑战。近年来,随着XML这样一种文档结构描述语言的不断发展和壮大,以XML及其相关技术为基础的半结构化信息表示技术正在影响着信息技术领域和计算机技术领域发生着重大的变化,本文探讨了如何运用XML技术,集成结构化和非结构化的问题。论文从以下几个方面的内容进行了阐述:(1)对集成的数据进行了分类,一类是结构化数据,另一类是非结构化的数据。在这里我们把半结构化的数据

4、看做是非结构化数据的特殊情况。本文提出一种对数据进行分类集成的策略,在Mediator/Wrapper的方式下,单独构建一个数据集成池,专门用来整合集成结构化数据。(2)详细论述了XHDIS信息集成系统原型的各个功能模块和系统构架。(3)对信息集成中的相关技术进行了深入分析,如模式集成及公共数据模型和包装器(Wrapper)模板生成等。(4)由于采用分类集成的策略,因而在非结构化数据的处理,本文的重点放在了如何通过定制非结构化数据的提取规制,通过转化成XML数据的形式来进行集成。重点讨论了以HTML/XML的Web页面的提取规则。最

5、后在总结全文的基础上,结合其它与集成系统相关技术的发展趋势,提出了若干有待进一步深入研究和探讨的问题。关键词:分类集成,公共数据模型,模式集成,数据池,数据颗粒I重大大学硕士学位论文英文摘要ABSTRACTWiththerapiddevelopmentofcomputernetworksandthestrongadvanceofinformationconstruction,nowtheamountofinformationavailableon-lineisproliferatingatatremendousrated.Howev

6、er,allthoseinformationformanydifferentapplicationsisindependentlystoredinagreatvarietyofdatasourcesandmanagedbydifferentsystems,andtheircontents,structuresandqualityaredifferentinthousandsways.Inordertoutilizethisinformationmoreeffectively,thereisaneedtointegrateinform

7、ationfrommultipledistributed,heterogeneousandautonomoussources,andmakedifferencesinvisibleandprovideuniformandtransparentaccesstothedataforallusers.Inaddition,itisnecessarytopreservedataintegrityandconsistencyoverdifferentsystems.Thus,howtoresolvethosedifferenceseffici

8、entlyisaseverechallengeinthedomainaboutapplicationandresearchofinformationintegration.Theseyears,withincreasingdevelo

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。