基于本体的语义检索系统的研究与应用new

基于本体的语义检索系统的研究与应用new

ID:33496488

大小:421.82 KB

页数:9页

时间:2019-02-26

基于本体的语义检索系统的研究与应用new_第1页
基于本体的语义检索系统的研究与应用new_第2页
基于本体的语义检索系统的研究与应用new_第3页
基于本体的语义检索系统的研究与应用new_第4页
基于本体的语义检索系统的研究与应用new_第5页
资源描述:

《基于本体的语义检索系统的研究与应用new》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、http://www.paper.edu.cn基于本体的语义检索系统的研究与应用董涛,孟祥武北京邮电大学计算机科学与技术学院,北京(100876)E-mail:tdong2005@yahoo.com.cn摘要:基于本体查询的语义检索是建立在SemanticWeb基础之上的一种检索技术。与传统搜索引擎技术相比,它极大地提高了系统的查全率和查准率。文章首先介绍了语义网和本体的基本概念,然后通过实际举例的概念层次图详尽地阐述了本体中概念及其关系的具体意义。最后利用本体构建工具Protege并结合本体的相关标准共同构建本体,通过JenaA

2、PI实现了基于OWL本体文件的语义查询系统。关键词:本体,语义网,OWL,Jena,Protege0.引言随着Internet的迅猛发展,互联网上的信息正在随指数的速度在迅速增长,出现了信息爆炸的问题。在如此浩瀚的信息海洋中,检索到有价值的信息成为当前计算机检索系统必须解决的问题。因此,信息检索技术成为当前热门的研究课题。目前,最主要的信息检索技术有两种。一种是基于目录的检索技术,它将相关主题的页面组织起来,形成一棵目录树。因此,检索的过程,就是遍历一棵目录树的过程。另一种是基于关键字匹配的检索技术,也是最常见的检索技术[1]。以

3、上两种信息检索技术在查全率和查准率方面还存在着很多欠缺之处。例如:当用户查询番茄时,搜索引擎只会将包含有“番茄”一词的页面提供给用户,而不会把包含有“西红柿”一词的页面也返回给用户。因此,这就存在着查全率的问题。与此同时,搜索引擎会把包含有“番茄花园”的页面返回给用户,但这并不是用户想得到的,因此,这在查准率方面就出现了问题。为了解决查全率和查准率的问题,就需要提高信息检索技术的精度和覆盖率。如何使搜索引擎更加智能化,使它能够充分理解用户的意图,是信息检索技术需要迫切解决的问题。近年来,语义网的提出为增强搜索引擎的智能化提供了良好

4、的解决方案。它将网络中的各种资源结构化,使得计算机能够识别、处理。计算机首先将检索词本体化,检索引擎通过解析、推理,然后将相关资源从本体库中提取出来,最后返回给用户。这种智能的检索技术能够提高用户的满意度,减少不相关的结果,得到更多相关的结果。本文从构建本体及其本体库的角度出发,结合实际的应用,阐述如何建立语义检索系统进行信息检索。1.语义网与本体的概述1.1语义网在2000年11月的XML2000会议上,TimBerners-Lee首次提出了语义Web的概念。他将语义Web定义为:语义Web是一个网,它包含了文档或文档的一部分,

5、描述了事物间的明显关系,且包含语义信息,以利于机器的自动处理。他于2000年提出了语义Web的体系结构[2],如下图所示:-1-http://www.paper.edu.cn图1语义Web的体系结构语义Web并不是要取代现有的Web,而是扩展。扩展的方式是对现有信息进行形式化的描述,目的是机器可理解,以便计算机更好地提供信息服务。简单的说,语义Web就是要给Web加上注释,为了让计算机能够理解,这种注释必须用一种形式化的语言进行描述,并且支持推理。为了多个系统之间能够交流,这种注释还应该遵循统一明确的词汇表。从整体看,语义网的核心

6、层为XML、RDF、Ontology。XML+RDF+Ontology构成了计算机相互理解的基础。在本体层之上进一步要做一些逻辑推理的工作,接下来就是保证信息是可信赖的,这就构成了一个多层次的语义网。上层将下层的语言机制作为本层的支撑语言,通过分析器,从合法有效的下层描述中抽取出本层所能理解的模型,实现了更多的语义处理功能。从目前的情况来看,语义Web下面三层的研究已经开展较长时间,研究成果相对较多,并推出了一系列的标准,可以说打下了比较坚实的基础。本体层和逻辑层,正在引起更多的关注。作为语义Web中从语法处理向语义处理的转折,这

7、两层起着至关重要的作用,相关研究正处在探索之中,已有很多有意义的尝试和应用,却还没有成熟的技术和标准,因此成为相关领域的研究热点。顶部的两层还没有可靠论证,只是基于逻辑系统的一个构想[9]。1.2本体Ontology的概念起源于哲学领域,即“对世界上客观存在物的系统地描述”。后来,本体被引入人工智能领域。1998年Studer等人提出:“Ontology是共享概念模型的明确的形式化规范说明。”这一定义已被多数人所认同[6]。(1)概念模型:指通过抽象出客观世界中的一些现象的相关概念而得到概念模型,即概念系统所蕴涵的语义结构,是对某

8、一事实结构的一组非正式的约束规则,可以理解和表达为一组概念(包括类、属性和过程)、定义和关系。(2)明确:指所使用的概念的类型以及对这些概念使用上的约束都有了明确的定义。(3)形式化:指本体论是计算机可读的(即能被计算机处理),而不是完全用自然语言

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。