基于本体知识库的受限领域自动问答系统

基于本体知识库的受限领域自动问答系统

ID:5382844

大小:207.00 KB

页数:8页

时间:2017-12-08

基于本体知识库的受限领域自动问答系统_第1页
基于本体知识库的受限领域自动问答系统_第2页
基于本体知识库的受限领域自动问答系统_第3页
基于本体知识库的受限领域自动问答系统_第4页
基于本体知识库的受限领域自动问答系统_第5页
资源描述:

《基于本体知识库的受限领域自动问答系统》由会员上传分享,免费在线阅读,更多相关内容在应用文档-天天文库

1、http://www.paper.edu.cn1基于本体知识库的受限领域自动问答系统1,2111刘杰,樊孝忠,陈康,陶利强1北京理工大学计算机科学技术学院,北京(10081)2首都师范大学信息工程学院,北京(10037)E-mail:liujxxxy@bit.edu.cn摘要:提出了一种应用本体知识库的受限领域自动问答(QA)系统结构,采用OWL语言描述领域本体知识库,通过Jena推理机从领域本体知识库中推理、抽取答案,提高了QA系统回答问题的准确性。文章以某不孕不育医院QA为例,分析了系统结构及实现过程,对问句分析

2、、领域本体知识库的构建、答案抽取进行了详细阐述。测试结果表明,准确率达到83.5%,召回率达到92%。关键词:受限领域自动问答系统;本体知识库;OWL中图分类号:TP3911.引言传统的搜索引擎根据用户提供的关键字返回相关网页,用户往往面对返回的大量网页无所适从,不能很快的找到自己需要的内容,而自动问答系统既能用自然语言句子提问,又能为用户直接返回所需的答案,而不是相关的网页。所以,问答系统能更好的满足用户的检索需求,能更快地找出用户所需的答案。[1]起源于哲学的本体论(ontology)近年来受到信息领域的广泛关注

3、,并得到广泛应用,[2]尤其是W3C国际标准本体描述语言OWL(ontologyWeblanguage)以描述逻辑为基础,在一定程度上促进了本体在各领域的应用。应用本体思想构建知识库可根据问句分析结果对答案推理,对受限领域QA答案提取的准确性、知识共享、知识重用起到重要作用,本文提出了一种基于OWL语言描述领域本体知识库的受限领域QA系统解决方案,并成功应用在一个不孕不育医院自动问答系统中。2系统结构:2.1系统设计思想使用基于描述逻辑的OWL语言描述本体库,有利于QA的答案抽取,使用Jena推理机可直接在OWL语言

4、描述的本体知识库里进行答案的推理、查找,并且Jena推理机支持自定义规则。知识库的结构必须要有相对应的问句分析的结果向量,因此我们改进了以语义块为基础的问句模板及结构化问句实例的问句向量分析方法,服务于答案抽取。该系统结构图如图1所示。1本课题得到教育部高等学校博士学科点专项科研基金(项目名称:受限领域自动问答系统,项目编号:20050007023)资助-1-http://www.paper.edu.cn知网提交问题返回答案通用词库预处理模块答案抽取模块领域词库领域本体知识同义词库库用户交互问句模板库问句分析问句实例

5、库匹配生成问句向量不成功成功图1受限领域QA系统结构图2.2领域知识资源的组织(1)通用词库:本系统选择中科院的研究成果通用词库CoreDict.dct,大约收录了十多万词条和标点,含有词性标注,以二进制文件形式存储。(2)知网:《知网》是一部比较详尽的语义知识词典,是一个以汉语和英语的词语所代表的概念为描述对象,以揭示概念与概念之间以及概念所具有的属性之间的关系为基本内容的常识知识库。知网中的每个词语由DEF来描述其概念定义,DEF由若干个义原及它们与主干词之间的语义关系描述组成。系统利用知网辅助问句语义块的分析和

6、问句相似度计算。(3)本体知识库:通过分析专业领域知识,提取领域本体概念、概念之间的关系、实例、属性等本体元素构成本体库。采用w3c国际标准语言owl描述医院本体库,形成本体知识库。(4)领域词库:包括类词库、实例词库、属性词库,分别存放本体知识库中的类名、实例名、属性名,首次运行系统时可由机器读取本体知识库文件把类名、实例名、属性名自动加入到类词库、实例词库、属性词库中。问句分词时领域词优先切分。用户更新本体知识库后系统可自动更新领域词库。3本体知识库的构建:领域知识库是受限领域QA系统的关键组成部分,用基于描述逻

7、辑(DL)的OWL语言描述本体知识库,对根据问句分析的结果在领域本体知识库中进行推理提供了依据,并且问答系统的问句分析和答案抽取都以本体知识库的构建为基础。-2-http://www.paper.edu.cn3.1领域本体库的构建领域本体库的构建包括类(概念)、实例、关系等元素的提取,需要领域专家的参与。本系统开发了机器辅助程序,结合手工的方法,在领域专家的指导下,采取自顶而下的方法提取本体元素。具体步骤包括:(1)文本搜集、整理(2)概念抽取、分类(3)关系抽取。抽取颗粒大小取决于问答系统答案抽取的需求,本系统颗粒

8、细化到每个具体症状和具体治疗方法,如“炎症性水肿”“微波治疗”等。3.2领域本体知识库的构建领域本体库采用采用OWL语言描述后即成为领域本体知识库,OWL是2002年正式成为[3]W3C推荐的WebOntology表示语言。OWL采用面向对象的方式来描述领域知识,即通过类和属性来描述对象,并通过公理(Axioms)来描述这些类和属性的特征和关系

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。