开放域问答系统研究综述.doc

开放域问答系统研究综述.doc

ID:55967887

大小:352.50 KB

页数:24页

时间:2020-06-18

开放域问答系统研究综述.doc_第1页
开放域问答系统研究综述.doc_第2页
开放域问答系统研究综述.doc_第3页
开放域问答系统研究综述.doc_第4页
开放域问答系统研究综述.doc_第5页
资源描述:

《开放域问答系统研究综述.doc》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、开放域问答系统研究综述*本文受到国家自然科学基金(70903008,60933004),CNGI搜索引擎项目(CNGI2008-122),863课题(2009AA01Z143),软件开发环境国家重点实验室开放课题(SKLSDE-2010KF-03)及973计划海量项目(2005CB321901)的共同支持。何靖1,翀2,闫宏飞1(1.大学,信息科学技术学院,,100871;2.师大学,管理学院信息管理系,,100875)E-mail:hjnet.pku.edu.,chenchongbnu.edu.,yhfnet.pku.edu.摘要:尽管搜索引擎能够满足网络用户的很多信息需求,但是还有

2、很多它无法满足。原因之一是它严格的用户界面:它的输入是关键词,它的输出是相关文档集。对于很多信息需求,更加合适的提问和回答方式是自然语言。开放域问答系统就是用于解决这一问题的。本文主要介绍开放域问答系统的系统框架,主要技术和评测方法。关键词:开放域问答系统;问题分析;信息检索;答案抽取ASurvey:Open-domainQuestionAnsweringSystemHEJing1,CHENChong2,YANHongfei11(DepartmentofComputerScienceandTechnology,PekingUniversity,Beijing100871,China)2

3、(DepartmentofInformationManagement,BeijingNormalUniversity,Beijing,100875,China)E-mail:hjnet.pku.edu.,chenchongbnu.edu.,yhfnet.pku.edu.Abstract:ThoughWebuserscanfindrelativeinformationwithsearchengine,itcannotsatifyallinformationneeds.Onereasonisthatitsinterfacetousersisrigid:keywordsasqueryandd

4、ocumentsasoutput.However,forsomeinformationneed,it’smoresuitabletobequeriedandansweredbynaturallanguage.Open-domainquestionansweringsystemisdesignedtosolvethisproblem.Inthissurveypaper,wewillintroducetheframeworkandcriticaltechniquesforanopen-domainquestionansweringsystemandpresenthowtoevaluatei

5、t.Keywords:Open-domainquestionanswering,questionanalysis,informationretrieval,answerextraction1概述1.1研究背景随着网络数据的快速增长,从海量网络数据中获得相关信息成为一个巨大挑战,搜索引擎在一定程度上解决了这个问题。在分析搜索引擎日志时发现,它包含一些自然语言表述的查询如“如何安装RedHat9”。这表明互联网用户更加习惯于用自然语言来表达他们的某些信息需求。搜索引擎的输入是一组关键词,但是有时用户的信息需求很难用关键词确切地表达。同时,有时用户所需信息的粒度并不是一篇文档,而是一个描述性

6、的段落、句子、结论、人名或数字等,但是搜索引擎对于一个查询返回的是一个文档集合,用户还需从中找出相关的容。这表明现有的搜索引擎服务和用户的实际信息需求之间存在着两个方面的“鸿沟”:系统要求的关键词表达方式与用户自然表达方式之间的鸿沟和系统返回信息的方式和用户需要返回的方式之间的鸿沟。如果能使用户以一种更加自然的方式和系统交互,用户可以自然而精确地表达他们的信息需求,系统能直接返回用户想要知道的容,就能填平这条鸿沟。基于这样的需求,开放域问答系统成为信息系统领域中继搜索引擎之后的又一个热点。从技术层面来看,计算机处理能力的提升,信息检索、自然语言处理、人工智能等相关领域研究的发展也为问答

7、系统的构建创造了条件。1.1问答系统的历史问答系统并不是一个年轻的研究方向。五十年代,AlanTuring提出了著名的图灵测试。该测试的目的是测试计算机是否具有智能。为了鼓励进行图灵测试的研究,1991年HughLoebner设立了LoebnerPrize,用于奖励第一个通过图灵测试的系统。十多年来,出现了PCTherapist,Albert等优秀的聊天机器人系统,它们的一些技术如问句答案的模式匹配,对开放域问答系统很有借鉴价值。除此之外,还有

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。