开放域问答系统研究综述

开放域问答系统研究综述

ID:18467017

大小:348.00 KB

页数:18页

时间:2018-09-18

开放域问答系统研究综述_第1页
开放域问答系统研究综述_第2页
开放域问答系统研究综述_第3页
开放域问答系统研究综述_第4页
开放域问答系统研究综述_第5页
资源描述:

《开放域问答系统研究综述》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、作者名等:题目17开放域问答系统研究综述*SupportedbyChinaNationalTechnologyPlatform,Grant2005DKA64001:BiologyInformaticsGrid;863Grant2006AA01Z196:PlatformforApplying,ResearchingAndDevelopingIntelligentSearchEngine;863Grant2007AA01Z154:OceanDataInformationRetrieval;作者简介:何靖(1982-),男,浙

2、江嘉善人,博士生,主要研究领域为网络信息检索和数据挖掘;闫宏飞(1973-),男,博士,副教授,主要研究领域为分布式系统、网络信息检索和数据挖掘;何靖1,闫宏飞1+1(北京大学计算机科学技术系,北京100871)ASurvey:Open-domainQuestionAnsweringSystemHEJing1,YANHong-Fei1+1(DepartmentofComputerScienceandTechnology,PekingUniversity,Beijing100871,China)+Corresponding

3、author:Phn:+86-10-62765815-8005,Fax:+86-10-62765813,E-mail:yhf@net.pku.edu.cnAbstract:ThoughWebuserscanfindrelativeinformationwithsearchengine,itcannotsatifyallinformationneeds.Onereasonisthatitsinterfacetousersisrigid:keywordsasqueryanddocumentsasoutput.However,

4、forsomeinformationneed,it’smoresuitabletobequeriedandansweredbynaturallanguage.Open-domainquestionansweringsystemisdesignedtosolvethisproblem.Inthissurveypaper,wewillintroducetheframeworkandcriticaltechniquesforanopen-domainquestionansweringsystemandpresenthowtoe

5、valuateit.Keywords:Open-domainquestionanswering,questionanalysis,informationretrieval,answerextraction摘要:尽量搜索引擎能够满足网络用户的很多信息需求,但是还有很多它无法满足。原因之一是它严格的用户界面:它的输入是关键词,它的输出是相关文档集。对于很多信息需求,更加合适的提问和回答的方式是自然语言。开放域问答系统就是用于解决这一问题的。本文主要介绍开放域问答系统的系统框架,主要技术和评测方法。关键词:开放域问答系统;问题

6、分析;信息检索;答案抽取中图法分类号:TP301  文献标识码:A1概述1.1研究背景随着网络数据的快速增长,从海量网络数据中获得相关信息成为一个巨大挑战,搜索引擎在一定程度上解决了这个问题。在分析搜索引擎日志时发现,它包含一些自然语言表述的查询如“如何安装RedHat9”。这表明互联网用户更加习惯于用自然语言来表达他们的某些信息需求。搜索引擎的输入是一组关键词,但是有时用户的信息需求很难用关键词确切地表达。同时,有时用户所需信息的粒度并不是一篇文档,而是一个描述性的段落、句子、结论、人名或数字等,但是搜索引擎对于一个查

7、询返回的是一个文档集合,用户还需从中找出相关的内容。这表明现有的搜索引擎服务和用户的实际信息需求之间存在着两个方面的“鸿沟”:作者名等:题目17系统要求的关键词表达方式与用户自然表达方式之间的鸿沟和系统返回信息的方式和用户需要返回的方式之间的鸿沟。如果能使用户以一种更加自然的方式和系统交互,用户可以自然而精确地表达他们的信息需求,系统能直接返回用户想要知道的内容,就能填平这条鸿沟。基于这样的需求,开放域问答系统成为信息系统领域中继搜索引擎之后的又一个热点。从技术层面来看,计算机处理能力的提升,信息检索、自然语言处理、人工

8、智能等相关领域研究的发展也为问答系统的构建创造了条件。1.1问答系统的历史问答系统并不是一个年轻的研究方向。五十年代,AlanTuring提出了著名的图灵测试。该测试的目的是测试计算机是否具有智能。为了鼓励进行图灵测试的研究,1991年HughLoebner设立了LoebnerPrize,用于奖励第一个通过图灵测试的

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。