基于patent ontology的智能检索系统demo

基于patent ontology的智能检索系统demo

ID:19793462

大小:449.50 KB

页数:34页

时间:2018-10-06

基于patent ontology的智能检索系统demo_第1页
基于patent ontology的智能检索系统demo_第2页
基于patent ontology的智能检索系统demo_第3页
基于patent ontology的智能检索系统demo_第4页
基于patent ontology的智能检索系统demo_第5页
资源描述:

《基于patent ontology的智能检索系统demo》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、基于Ontology的智能检索技术研究与实践受中国科学院青年创新基金项目:《基于本体的智能检索技术探索与实践》资助。1、本文中涉及程序代码有部分来自于Franz公司StudyCenter的教学代码及Jena的参考文档。技术白皮书《基于本体的智能检索技术探索与实践》课题组2008年12月基于PatentOntology的智能检索系统Demo相关背景与传统数据库相比,知识库是一种全新的信息组织方式与信息服务模式,它不包含了大量的信息,而且也包含了信息之间的规则和关联。其特点是:存储海量结构化/非结构化信息,信息或者知识随时添

2、加;通过在原始数据层上添加语意层,实现信息之间可推导及知识发现;通过语意层,提供基于知识的查询。知识库的这些特性支持:运用最新的智能工具来挖掘蕴藏于海量显性信息中的隐性知识,并实现知识的可检索、可推导,并形成专业知识库和知识仓库,将隐性知识显性化并给予管理、利用,非常符合知识服务中用户对个性化、隐性知识的需求,能够真正支撑起信息化建设中要求的显性知识与隐性知识全方位开发战略。知识库通过有效促进知识的流转与共享过程,加速了隐性知识的显性化,促发新知识的发现。在未来的信息化系统建设中,以知识库为基础的信息化平台建设将逐渐成为

3、主流。对于知识库而言,其最核心的部分是”如何合理有效的表示知识”,即知识表示。知识表示是对知识的一种描述或一组约定,是知识的形式化和符号化过程。本体(ontology)通过对于概念、术语及其相互关系的规范化描述,勾画出某一领域的基本知识体系和描述语言。虽然基于本体的知识库研究仍处于发展的前期,在技术与应用上还有很多难题尚待解决,但其已成为建设知识库的主流技术,已经引起了学术界与产业界的广泛关注,一些面向实际应用的知识库系统也已经出现。基于本体的智能检索技术作为知识库系统的重要组成部分,其研究与实践对知识库系统的建设将大有

4、裨益。本技术指南是中国科学院青年创新基金项目:《基于本体的智能检索技术探索与实践》项目研究总结。其主要内容是:从理论探讨了知识库系统的框架层次,并分析了每一层具体功能与部分技术细节。在实践方面,重点实践了与智能检索技术密切相关的数据层、语义图层、推理层相关技术。以基于专利本体的智能检索为例,根据上述理论研究成果,进行了探索与实践。该Demo检索模块主要针对专利检索中的申请人字段进行基于本体的扩展,首先从检索分析器中提取出可以进行本体扩展的部分,然后由本体库的推理引擎对其进行扩展,实现智能检索。重点讨论了本体的持久化、利用

5、Prolog实现本体推理、基于SPARQL的本体查询等技术。通过实践,总结了基于本体的智能检索技术与传统检索扩展技术的区别,在实践上总结了规则与本体结合的重要性,希望为国科图知识库系统研建起到抛砖引玉的作用。体系结构本体建模目前,还没有公认的最佳本体建模方法,大多处于具体问题具体分析阶段。经调研,主要有以下三种本体建模方法:爱丁堡大学总结出来的“骨架法”、多伦多大学总结的TOVE本体建立模式、马德里大学工艺分校开发人工智能图书馆时发展出来的Meth本体方法等。有学者认为如使用IEEE标准—软件生命周期法IEEE1074来

6、评价上述方法,“骨架法”更符合该评价标准。其开发过程简述如下:根据研究领域的任务等实际情况,确定本体的应用目标和范围。吸引专家参与进行本体分析,确定本体中术语意义及其关系。最大限度搜索已存在的Ontology,避免资源重复建设,利用本体的开放性,对本体进行提炼、扩充。并对Ontology进行初步设计。根据本体构造原则,运用适当语言对术语及其关系进行形式化描述。确定评价标准,对本体进行评价。最后在上述基础上建立本体[1,2,3]。项目组也认为“骨架法”是目前较好的本体建模方法。有关“骨架法”的具体描述请参见参考文献2。需要

7、说明的是,各种本体建设方法论多诞生在具体的本体建设项目之中,在相应的项目中得到实践。这些方法之间并没有太大的差别,并且都和软件工程中常见的开发过程相类似,可以综合一下这几种方法,从而制定自己的一套方法论[2]。现在本体构建工具多达十余种,其功能重点面向本体构建的各个方面,对于本体语言的支持能力、表达能力、逻辑支持能力以及可扩展性、灵活性、易用性等都相差很大,其中较著名的有Protégé、TBC、NeOnToolkit、OntoEdit、OilEd、Ontolingua等。Protégé是一个斯坦福大学开发的本体编辑和知识

8、获取软件。开发语言采用Java,属于开放源码软件,由于其优秀的设计和众多的插件,Protégé已成为目前使用最广泛的本体论编辑器之一,Protégé本体可导出为各种格式,包括Clips、UML、DAML+OIL、RDF(S)、OWL和XMLSchema[4]。目前,Protégé用户群体非常广泛,隐约成为本体编辑的代

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。