基于语言模型的信息检索中负反馈技术的研究与实现.pdf

基于语言模型的信息检索中负反馈技术的研究与实现.pdf

ID:57745366

大小:2.34 MB

页数:72页

时间:2020-03-27

基于语言模型的信息检索中负反馈技术的研究与实现.pdf_第1页
基于语言模型的信息检索中负反馈技术的研究与实现.pdf_第2页
基于语言模型的信息检索中负反馈技术的研究与实现.pdf_第3页
基于语言模型的信息检索中负反馈技术的研究与实现.pdf_第4页
基于语言模型的信息检索中负反馈技术的研究与实现.pdf_第5页
资源描述:

《基于语言模型的信息检索中负反馈技术的研究与实现.pdf》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库

1、魄》。,分类号UDC论文题目10126.30809015密级编号研究生:塞连挞指导教师:王俊幺数援专业:让篡扭型堂皇撞盔研究方向:值息捡塞:所在学院:让篡扭堂瞳2011年06月10日}.一慷㈧悖㈠㈧旧‘㈠!j原本人声明:所呈交的学位论文果。除本文已经注明引用的内容外,论文中不包含其他人已经发表或撰写过的研究成果,也不包含为获得凼墓直太堂及其他教育机构的学位或证书而使用过的材料。与我一同工作的同志对本研究所做的任何贡献均已在论文中作了明确的说明并表示谢意。学位论文作者签名:塞氇挞指导教师签名:日期:纽l!!笪!!篁日期:

2、2Qll!笪!竖在学期间研究成果使用承诺书本学位论文作者完全了解学校有关保留、使用学位论文的规定,即:内蒙古大学有权将学位论文的全部内容或部分保留并向国家有关机构、部门送交学位论文的复印件和磁盘,允许编入有关数据库进行检索,也可以采用影印、缩印或其他复制手段保存、汇编学位论文。为保护学院和导师的知识产权,作者在学期间取得的研究成果属于内蒙古大学。作者今后使用涉及在学期间主要研究内容或研究成果,须征得内蒙古大学就读期间导师的同意;若用于发表论文,版权单位必须署名为内蒙古大学方可投稿或公开发表。学位论文作一:础指导教臌:塞

3、逢∑,日内蒙古大学硕士学位论文基于语言模型的信息检索中负反馈技术的研究与实现摘要2l世纪是网络经济的时代,伴随着互联网的迅速发展,internet上的信息量在不断增加,然而如何从浩瀚的信息海洋中得到所需要的信息就显得更加有“意义。在信息检索中,搜索引擎使用排序算法对被检索文档根据与查询的相关性大小进行排序,研究者们提出了关于相关性的数学检索模型。语言模型是目前性能较好的模型。对于困难查询(difficultquery)来说,检索结果较差并且排序靠前的文档很少有与用户需求相关的,怎样在语言模型下使用那些不相关的信息来提高

4、检索精度呢?就提出了相关反馈技术的特殊情形即负反馈技术。本文主要提出了基于语言模型的信息检索中正相关反馈和负反馈相结合的方法,在语言模型框架下应用类似于向量空间模型中的Rocchio反馈方法的反馈算法,对查询进行扩展和查询词的概率进行修改。本文主要考虑初次检索结果的前十个文档,作为查询扩展的局部文档情形,一般传统地认为这十个文档都是相关文档,用来进行伪相关性反馈。本文是将前十个文档分开考虑,根据与标准的相关性判断文件的比较,将它们分为与查询相关的文档集和与查询不相关的文档集,分别与原查询生成正模型和负模型,即在正模型中

5、出现又在负模型中出现的词加到查询中对查询进行扩展,并且适当地增加在相关文档中出现的查询词的概率,减少在不相关文档中出现的查询词的概率,即把相关性反馈和负反馈相结合来提高扩展后查询的精确度,从而使得新查询模型的检索结果性能较伪相关性反馈后的查询和原查询都有很大的提高。●Ⅱ,-口>内蒙古大学硕士学位论文RESEARCHANDIMPLEMENTATIONoFNEGATIVEFEEDBACKININFoRMATIONRETIUEVALBASEDONLANGUAGEMoDELABSTRACTThe21stcenturyisthe

6、timesofnetworkeconomy,withtherapiddevelopmentofintemet,theamountofinformationontheintemetisincreasing,however,howtogettheinformationmeyneedfromthevastoceanofinformationbecomemoremeaningful.Ininformationretrieval,searchengineuserankingalgorithmtosorttheretrievedd

7、ocumentsaccordingtherelevancebetweenthequeryanddocuments,theresearcherspresentedamathematicalretrievalmodelofrelevance.Atpresent,languagemodelhasbetterperformance.Forthedifficultquery,thesearchdocumentssortedfrontoftheresultsarepoor,andlittledocumentsareassociat

8、edwiththeuser’Squeryneeds.Inthiscase,howtousetheno·relevantinformationtoyimprovetheretrievalaccuracy?Researchersproposedanegativefeedbackwhichisaspecialcaseofrelevanc

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。