一种基于领域本体的语义检索系统的设计与实现

一种基于领域本体的语义检索系统的设计与实现

ID:22508324

大小:57.25 KB

页数:16页

时间:2018-10-29

一种基于领域本体的语义检索系统的设计与实现_第1页
一种基于领域本体的语义检索系统的设计与实现_第2页
一种基于领域本体的语义检索系统的设计与实现_第3页
一种基于领域本体的语义检索系统的设计与实现_第4页
一种基于领域本体的语义检索系统的设计与实现_第5页
资源描述:

《一种基于领域本体的语义检索系统的设计与实现》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库

1、一种基于领域本体的语义检索系统的设计与实现[摘要]基于领域本体的语义检索被认为是解决目前信息检索领域中所面临的困难的途径之一。从语义推理、查询分析等几个关键方面对基于领域本体的语义检索进行研宄,在此基础上设计并实现一个基于领域本体的语义检索实验系统,通过测试表明该系统能够较为有效地实现语义检索,提高检索精度。[关键词]领域本体语义检索语义推理Jena[分类号]G3541引言以计算机技术、通信技术和网络技术为代表的现代信息技术的飞速发展,改善了信息检索技术的软硬件环境,促进了信息检索理论与实践的发展,同时也给信息检索带来了新的挑战。如何从海量信息资源中快速、准确、高

2、效地检索到所需信息,是现阶段值得关注的问题。用户对高质量信息的需求和利用与信息量急剧增长之间的矛盾,尚未得到很好的解决。而语义检索能适应用户的现实信息需求及其发展变化。领域本体描述了领域知识模型,基于领域本体可以实现语义检索,提高检索精度。目前有不少关于领域本体的语义检索的理论研宄论文,但从实践角度构建检索系统,进行测试和评价的论文还很少。本文将以领域本体为基础,研究基于领域本体的语义检索关键技术,并在此基础上设计并实现了一个基于领域本体的语义检索模型,通过测试对该模型的性能和不足之处进行了分析。2相关研究目前绝大多数搜索引擎以及专业全文数据库,都采用关键词检索方

3、式。基于关键字(词)的机械匹配进行检索的方式严重地割裂了字、词间的语义关联,检索过程不包含任何语义信息,导致用户查询获得的检索结果不尽如人意。这种查询机制缺乏智能性和知识性,越来越难以满足人们日益增长的知识需求。为了克服关键词检索的不足,学者们提出了另外一种称为概念检索的检索方法,这种方法通过概念词典对用户的检索提问进行规范、查询和扩展来理解用户的检索意图。概念词典一般是由专家手工定义的专业词表或者通过机器学习生成的关联概念空间。概念检索方法虽然克服了基于关键词检索中不考虑语义信息的局限性,但不足之处在于概念词典表达的概念关系有限,而且无法表现公理、规则等。以上两

4、种方法可以看作是初级的语义检索方式,虽然能在一定程度上解决基于关键词检索方式的不足,但对于能够理解用户的检索意图,理解关键词所表达的语义这些高级功能还无法实现。因此,需要有一种比叙词表、关联概念空间更为丰富的语义表达工具作为检索的支撑,而本体的特性恰好适合于知识表达,能够充分描述知识模型,支持语义推理,同时采用通用的知识建模语言,更适合网络环境下的知识共享和互操作。3系统设计3.1设计原理基于领域本体的语义检索系统的设计核心,是在查询和检索资源中引入领域本体层作为匹配和推理的核心部件。与传统的检索方法相比,增加了一个本体检索推理层,其工作机理如图1所示。领域本体在

5、构建的时候已经对该领域的概念进行了分类,每个类别下有具体的实例,每个实例赋予了一定属性关系。系统在获得了用户的检索关键词之后,通过语义推理以及RDQL语句的构建,将会对本体库发出查询指令,如果在本体库中存在满足条件的实例,那么该实例就会被检索出来,从而使得计算机“理解”用户的查询库进行检索本体的查询结果将作为二次检索词对文献资源3.2总体设计根据上述原理,本文设计了一个基于领域本体的语义检索系统,该系统主要由以下四个模块组成:?提问分析模块。主要作用是对用户的提问式进行处理,过滤停用词,抽取具有检索意义的实词并且判断用户的提问中心。?语义推理模块。主要作用是根据用

6、户的提问词进行语义关系判断,判断出各个提问式之间隐含的语义关系,明确用户的真正检索意图。?查询分析模块。在语义推理的基础上,根据语义关系,自动构建RDCU查询语句,对本体库进行查询,并且把查询结果返回给用户。?本体管理模块。主要是本体的浏览、导航和可视化显示作用,通过本体浏览模块可以清晰地发现概念之间的关系,可视化组件可以对领域本体中的概念关系以动态图的形式直观展现出来。4系统实现本文采用java语言实现了一个基于领域本体的含义检索系统,该系统所采用的开发环境是Windows2000,JDKI,5,开发工具为」Builder2005以及语义开发包Jena2.3o4

7、.1提问词分析模块?抽词。抽词模块首先对用户的检索式进行处理,抽取其中有检索意义的实词。?检索词标注。利用领域本体中的类别信息对检索词进行标注,将具体实例标注为其所属的类,这是对检索词进行的规范化处理,是建立计算机理解检索词的基础。?抽取提问中心。抽取用户的提问中心,是对用户的检索词进行语义判断的基础。在用户的检索式中,提问中心通常是抽象词,而具体的实例则是对提问中心的限制或描述。抽取提问中心的方法是利用领域本体的类(Class)对检索式进行抽取,抽取到的类名词则为提问中心。4.2查询分析模块传统的信息检索模型是将各个检索词看作是孤立的,忽略检索词之间的语义关系,

8、这也是造成

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。