基于本体的deep+web信息集成关键技术研究

基于本体的deep+web信息集成关键技术研究

ID:33745058

大小:9.96 MB

页数:154页

时间:2019-02-28

基于本体的deep+web信息集成关键技术研究_第1页
基于本体的deep+web信息集成关键技术研究_第2页
基于本体的deep+web信息集成关键技术研究_第3页
基于本体的deep+web信息集成关键技术研究_第4页
基于本体的deep+web信息集成关键技术研究_第5页
资源描述:

《基于本体的deep+web信息集成关键技术研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、苏州大学博士学位论文基于本体的DeepWeb信息集成关键技术研究姓名:方巍申请学位级别:博士专业:计算机应用技术指导教师:崔志明20090501基于本体的DeepWeb信息集成关键技术研究中文摘要随着万维网(WWW)的飞速发展,Web尤其是DeepWeb蕴含了各种各样的海量高价值信息,并且仍在以惊人的速度增长。DeepWeb上的信息具有异构性、自治性和动态性等特点,这些特点决定了传统结构化信息集成方法己不能满足人们的需求。为了方便用户快捷准确的使用DeepWeb中高价值信息,基于本体的Deepwreb信息集成

2、研究已成为一个非常迫切的问题,具有重要理论意义和广阔应用前景。在对DeepWeb信息集成的研究现状和发展趋势进行了深入的分析后。在课题组前期工作的基础上,提出了一种基于本体的DeepWeb信息集成方案。该方案包括面向DeepW

3、eb不确定知识表示的动态模糊描述逻辑方法、基于最大熵和本体的数据源发现技术、基于质量估计模型的数据源选择方法、以及基于多数据源同步标注的信息抽取和DeepWeb语义集成中模糊性本体映射方法等内容。本文的主要研究工作和取得的创新成果包括:(1)一个完整、准确的本体是基于本体的DeepWe

4、b信息集成的必要前提。本文根据DeepWeb特征半自动构建了DeepWeb领域本体,并针对DeepWreb本体学习和本体映射过程中存在不确定性知识表示问题,提出了一种面向Deepwreb不确定知识表示的动态模糊描述逻辑方法(DFDLs),该方法弥补了传统描述逻辑方法对不确定性知识表示的不足。(2)针对DeepWeb数据源的动态性和稀疏分布的特征,提出了一种基于最大熵分类器和领域本体的DeepWeb数据源发现方法,该方法首先通过最大熵分类器进行DeepWeb查询接13自动判定,然后利用基于本体的DeepWeb聚

5、焦爬虫发现DeepWeb数据源,该方法使得聚焦爬虫聚焦访问那些可能链接到DeepW

6、eb入口页面的链接,从而避免访问下载不必要的页面。(3)通过服务质量可以评价DeepWeb数据源的优劣,本文提出了一个基于领域本体的DeepWeb数据源质量估计模型,并将其应用于DeepWeb数据源选择过程中。采用此模型能够选取最符合用户需求的数据源,达到查询代价更少,效率更高中文摘要基于本体的DeepWeb信息集成关键技术研究的要求。(4)针对信息抽取过程中存在接口模式和结果模式缺失的问题,提出了一种多数据源间的同步标注方法

7、。从一组DeepW曲接口模式和结果模式中高效地学习领域本体知识,通过对本体的实例查询可实现多数据源间的同步标注。并成功应用此方法于DeepWeb复杂结果页面抽取过程中。(5)针对基于本体的DeepWeb信息集成过程中存在的不确定性模式匹配问题,将模式匹配问题转化为本体映射问题,提出了一个模糊性本体映射框架。在此框架中,运用了多个本体映射策略,从不同方面多个角度对本体特征进行描述,尽可能的发掘可能存在的映射关系,从模糊性角度表述映射过程。该方法为基于本体的DeepWeb信息集成提供了一种有效和通用的自动映射策略

8、。(6)DeepWeb语义集成原型系统设计,本文根据所研究的关键技术和实际应用需求,设计并实现了一个DeepWeb语义集成原型系统,该原型系统具有数据源发现、数据源选择、信息抽取和语义集成等功能。实际应用表明,该系统具有一定实用价值。本项研究工作受到国家自然科学基金项目“面向DeepWeb的不完备知识处理的逻辑模型研究’’(编号:60673092)、江苏省高技术研究计划项目“面向DeepWeb的搜索和挖掘关键技术研究”(编号:BG2005019)、江苏省高校研究生科研创新计划项目“基于本体的DeepWeb数据

9、源发现与选择技术研究"(编号:CX08B.099Z)以及2008年苏州大学优秀博士论文选题项目资助(苏大研字[2008122号)的资助。关键词:DeepW曲,信息集成,本体,知识表示,数据源发现,数据源选择,信息抽取,本体映射lI作者:方巍指导老师:崔志明(教授)ResearchonKeyTechnologiesofOntology-BasedDeepWebInformationIntegrationAbstractonKeyTechnologiesofOntology--BasedDeepWebInform

10、ationIntegrationAbstractAstherapiddevelopmentofWordWideWeb(www),WebespeciallyDeepWebcontainsvariouskindsofhugehigh-valuedinformationwhichisdevelopingatanamazingspeednow.InformationhiddeninDeepWebhassuc

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。