欢迎来到天天文库
浏览记录
ID:24434284
大小:49.50 KB
页数:3页
时间:2018-11-14
《体裁在信息检索中的应用》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库。
1、体裁在信息检索中的应用 摘要:体裁是信息检索中重要的上下文因素之一。文章阐述了体裁的含义,重点说明了数字体裁的含义、识别与描述,介绍了体裁在信息检索中的应用现状,并分析了体裁在应用中所面临的识别、标注等问题;同时指出在未来发展中,体裁作为检索目标与文档目标的表现方式之一,应独立于内容与用户当前任务进行单独匹配。为将体裁作为独立维度应用于检索系统以提高返回结果相关度,引入DCG作为评价指标。实验结果表明,该方法能有效提高检索效果。 关键词:体裁;信息检索;上下文;匹配;任务 :TP391.1文献标志码:A
2、:1006-8228(2012)05-29-03 ApplicationofGenreinInformationRetrieval LiXiaoyun,YangXiaohua,aJiayu,LiuZhiming,JiangHui (CollegeofputerScienceandTechnology,UniversityofSouthChina,Hengyang,Hunan421001,China) Abstract:Genreisoneofthemostimportantcontextualfact
3、orsinthecontext-driveninformationretrieval.Thenotionofgenreationretrieval.Furthermore,concludedsomeproblemsexistedincurrentresearch,includingautomaticidentificationandannotationofgenre,andproposedthatgenrecanbeusedtoreflectbothsearchgoalanddocumentintent,an
4、dthenservesasanunattacheddimension,besidesthetopicdimension,tomatchthepurposebetationneedanddocuments.Theexperimentalresultsdemonstratedthepotentialofgenretoimproveinformationretrieval. Keyationretrieval;context;match;task 0引言 中国互联X络发展状况统计报告[1]显示,超过76%的X
5、民选择使用以搜索引擎为代表的信息检索系统搜索X络资源。近年来,如何提高信息检索质量一直是信息检索领域的研究热点。信息检索是一个复杂且多变的过程,不同上下文情境会让用户产生不同的信息需求。在过去数十年中,信息检索的发展经历了一个从以系统为中心,到以用户为中心,再到目前基于上下文检索的过程[2]。2005年信息检索领域顶级会议SIGIR专设的IRiX讨论组分析了信息检索中的各类上下文因素,2006年欧洲信息检索大会(ECIR)强调上下文是影响检索质量的关键,其他多个国际会议,如IIiX(2006至今)、Conte
6、xt-BasedIR(CIR,2005,2007)、AdaptiveIR(AIR,2006,2008)以及CIRSE(2009,2010)等亦专门讨论了上下文信息检索技术(ContextualIR,CIR)。由此可见,上下文驱动的信息检索已成为目前的研究热点。 美国学者Ingl;m和Åkesson[9]通过对X络在线报纸的分析,提出了一个四元组<内容,形式,功能,位置>来描述这种新媒介的体裁。 3体裁在信息检索中的应用现状 信息检索领域中,用户检索目标和文档写作目标的推测一直是研
7、究热点。在推测文档目标方面,目前的主要方法有,分析文档内部词语特征,分析在写作过程中对文档的编辑、修改等行为,分析文档表示模型的主题相关性,或是挖掘文档的隐性知识来推断写作目标[11]。这些研究在一定程度上改进了文档描述模型来推测文档目标,但本质上都是对文档及其相关上下文内容进行分析。事实上,文档分类要么依据内容或主题,要么依据体裁。例如,对学术文献的分类,从内容角度分为计算机,语言学,经济学等,从体裁角度则分为论文,研究报告,市场调查表等。与内容相比,文档体裁包含大量上下文信息,因此,目前有许多研究正是利用
8、体裁来改善信息检索效果。 依据各类上下文推测出的查询目标和文档目标,主要应用在查询扩展、检索结果过滤、目标独立匹配等方面。近年来,以查询目标与文档目标直接进行匹配逐渐成为趋势。体裁天生就可用来表达文档的交际目标。Rosso[6]指出,文档体裁能表达出内容所不能、亦不会表达的信息。由此可见,体裁对于特定场景下判断文档与用户检索意图的相关性具有关键作用。2007年TGSE研讨会(ToulativeGa
此文档下载收益归作者所有