基于ontology的web信息检索

基于ontology的web信息检索

ID:34573066

大小:1.70 MB

页数:43页

时间:2019-03-08

基于ontology的web信息检索_第1页
基于ontology的web信息检索_第2页
基于ontology的web信息检索_第3页
基于ontology的web信息检索_第4页
基于ontology的web信息检索_第5页
资源描述:

《基于ontology的web信息检索》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、局限性。目前本体的研究与应用主要包括三方面:(1)本体的理论研究,包括概念及概念分类、本体上的代数等,其中最有代表性的是Guarino等人对概念及其分类进行的研究工作。Guarino等人提出的概念分类体系,不仅从理论上澄清了概念分类上存在的模糊和混淆的现象,同时为实际应用中本体概念模型的建立提供了良好的分析、设计和评估的手段;(2)在信息系统中的应用,主要包括处理信息组织、信息检索和异构信息系统互操作问题,一般需要用一种描述语言表示本体,数据保存在知识库中,采用描述语言的逻辑推理能力来完成信息检索。由于本体能通过概念之问的关系来表达概念语义的

2、能力,所以能够提高检索的查全率和查准率:(3)本体作为一种能在知识层提供知识共享和重用的工具在语义Web中的应用。语义Web的目标是使得Web上的信息具有计算机可以理解的语义,满足智能软件代理(Agent)对万维网上异构和分布信息的有效访问和搜索。本体通过对概念的严格定义和概念与概念之间的关系来确定概念精确含义,表示共同认可的、可共享的知识。因此在语义Web中,本体具有非常重要的地位,是解决语义层次上Web信息共享和交换的基础【2】.1.2本文研究内容本课题基于eBFDOntology系统的设计与实现,研究其如何从多个不同的Web站点抽取出所

3、感兴趣的数据;按照系统的需求设计出合适的Ontologyowl文件;通过Jena技术把从各个不同站点中抽取出来的数据转存成本地的本体库,最后用户通过搜索本体库获取所关心得数据。本文在总结回顾了信息检索技术的基础上得出了现有的信息检索的不足,从而引出了基于本体的信息检索模式。然后着重研究了Ontology,特别探讨了Ontology的内涵和外延及其在语义检索系统中所起的作用;研究了HPLab开发的语义Web应用系统开发工具包Jena在实现语义检索系统中的作用,并介绍了Jean所支持的三种本体描述语言RDFS,DAML+OIL和OWL。其中OWL

4、是本文关注的重点。最后介绍应用上述知识来开发现实中的一个本体项目,使得自己的研究最终得到实际的应用。通过该系统用户可以在同一时刻开始系统所覆盖的所有站点的信息,在查整率和查全率及实用性上取得长足的进步。1.3本文结构架。第一章为绪论,就本课题的研究背景做了介绍,并介绍了论文的内容及框4第二章为信息检索的概论,本章阐述了信息检索的含义、模型和方论上建立了信息检索的基础。第三章为基于本体的信息检索,详细阐述了本体的定义、本体建模元语、本体构建的原则和方法、本体在信息检索系统中的应用以及用的状况。第四章重点介绍了lena的基本框架,包括了lena所

5、支持的三种本体描述与杨,以及lena作为一个标准的框架结构建立兼容性强、可扩展性强的检索系统中的核心作用。第五章对eBankingFinancialOntology检索系统进行的分析介绍,对Ontology在Web信息检索上应用进行了实例举证。第六章总结了基于本体的信息检索系统设计、实现过程中的心得和不足.5第二章信息检索概论2.1信息检索的含义对于信息检索,主要存在时间性通讯、信息处理和文献查找三种角度的认识:莫尔斯在1950年发表了《把信息检索看作是时间性的通讯》一文,不仅首次提出了信息检索这个概念,并认为“信息检索是一种时间性的通讯形式

6、"。也就是说,通过信息检索得到了一些文献,从而使得文献作者和文献阅读者之间建立一种通讯。按照这种通讯角度的认识,莫尔斯强调了在通讯双方中,信息发送者必须尽可能发送一切信息,是时间通讯的被动一方;而信息接受者是主动活跃的一方,正是接受者才有权决定什么时候接受及接受什么信息。因此,信息检索的问题就在于如何把一个可能的用户指向所存储的信息。这充分的突出了用户需求的重要性,对于如何做好信息检索服务工作,至今依然具有很强的理论和实践意义。从信息处理的角度来看,信息检索的基本问题是如何处理信息和信息的结构。这种认识偏重于信息管理,认为信息不仅限于文献范围

7、,图像、声音、数据等也同样能反映信息,并把信息检索视为计算机科学与技术的一个分支。把信息检索看作是一种信息处理的认识,强调了如何构造以及利用什么形式来构造信息结果的问题。从文献查找角度来看,信息检索,简言之就是查找出符合用户所需信息的文献的过程。英国学者维克利(B.C.Vickery)就对信息检索作过这样的定义:信息检索是从汇集的文献种选出特定用户在特定时间所需信息的操作过程。信息检索(IR,InformationRetrieval)就是从大量收集的文档集合中,找到与给定的用户信息需求相关的恰当数目的文档子集。根据对信息检索模型的研究,我们知

8、道目前矢量模型(vectormodel)在研究者、开发者和Web团体中居于主导地位。但是现有Web上的信息检索仍然很难令人满意。比如假设我们在Web上想找关于中国首

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。