基于共现距离与查询扩展的蒙古文信息检索系统.pdf

基于共现距离与查询扩展的蒙古文信息检索系统.pdf

ID:52403478

大小:1.86 MB

页数:58页

时间:2020-03-27

基于共现距离与查询扩展的蒙古文信息检索系统.pdf_第1页
基于共现距离与查询扩展的蒙古文信息检索系统.pdf_第2页
基于共现距离与查询扩展的蒙古文信息检索系统.pdf_第3页
基于共现距离与查询扩展的蒙古文信息检索系统.pdf_第4页
基于共现距离与查询扩展的蒙古文信息检索系统.pdf_第5页
资源描述:

《基于共现距离与查询扩展的蒙古文信息检索系统.pdf》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库

1、分类号UDCTP391.3论文题目密级编号10126-30713039专2011年6月10日‘●原创性声明lIlflIIIIIIIIIIIIl\1887439本人声明:所呈交的学位论文是本人在导师的指导下进行的研究工作及取得的研究成果。除本文已经注明引用的内容外,论文中不包含其他人已经发表或撰写过的研究成果,也不包含为获得内蒙直太堂及其他教育机构的学位或证书而使用过的材料。与我一同工作的同志对本研究所做的任何贡献均已在论文中作了明确的说明并表示谢意。学位论文作者签名:壅曼基指导教师签名:Et期:竺!

2、!:』!!£日期:在学期间研究成果使用承诺书本学位论文作者完全了解学校有关保留、使用学位论文的规定,即:内蒙古大学有权将学位论文的全部内容或部分保留并向国家有关机构、部门送交学位论文的复印件和磁盘,允许编入有关数据库进行检索,也可以采用影印、缩印或其他复制手段保存、汇编学位论文。为保护学院和导师的知识产权,作者在学期间取得的研究成果(含计算机软件、程序)属于内蒙古大学计算机学院。作者今后使用涉及在学期间主要研究内容或研究成果,须征得内蒙古大学计算机学院就读期间导师的同意;若用于发表论文,版权单位必须

3、署名为内蒙古大学计算机学院方可投稿或公开发表。学位论文作者签名:壅墨垒指导教师签名:日期:趔L』!,上日期:1'内蒙古大学硕士学位论文基于共现距离与查询扩展的蒙古文信息检索系统摘要随着互联网技术的迅速发展,Web信息正以指数级的速度增长,如何在这些海量的信息中检索出用户需要的信息已成为一个非常重要的课题。由于用户查询词与文档关键词不匹配,传统信息检索的结果不太理想,不能满足用户的查询需求。因此,对信息检索中的查询扩展技术的研究,通过扩展用户的初始查询来有效解决“词不匹配”问题,具有重要的理论意义和实

4、用价值。本文的主要工作包括:(1)介绍了本文的研究背景,包括信息检索的概念、性能评价标准、检索模型等,综述了查询扩展的相关知识。f2)为了搭建一个具有较高查全率及查准率的蒙古文信息检索平台,我们从蒙古文的构词和语法等方面特点进行分析,设计了蒙古文索引项(Term)的处理方案,包括蒙古文Term的区分及Stemming规则的确定。实验结果表明蒙古文停用词表在有效减少索引大小的同时,提高了检索的查准率,Stemming规则能大幅度减少Term个数,并有效提高检索的查全率。(3)本文提出了一种词间相关性计

5、算方法与候选词距离关系模型,通过计算查询词与候选词之间距离关系来作为判定二者相关程度一个因素。结合距离模型和词间相关性计算方法,我们提出了一种新型的查询扩展算法,应用于查询扩展,所选扩展词和查询整体关联,较好地反映了查询主题。实验结果表明该算法能够●有效地抑制“查询漂移"。基于共现距离与查询扩展的蒙古文信息检索系统(4)在蒙古语语料上进行实验,以信息检索模型的结果作为baseline,对本文提出的两种查询扩展算法(词间相关性计算方法、基于距离模型的词间相关性计算方法)进行了性能分析与比较。实验结果表

6、明:两种算法较之haseline在查准率、平均准确率等方面均有一定改善,能提高信息检索的性能。关键词:查询扩展,距离模型,共现距离,信息检索,词间相关性计算方法ⅡCo..occurrenceDistanceandQueryExpansionBasedMongolianInformationRetrievalSystemAbstractWiththerapiddevelopmentofInternettechnology,Webinformationisgrowingatailexponentialr

7、ate,howtoretrieveinformationinthevastamountofinformationhasbecomeaveryimportantissue.Becausetheuserquerykeywordsnotmatching埘thdocuments.thetraditionalinformationretrievalresultsarenotideal,whichcannotmeettheuser’squerydemands.Therefore,queryexpansionof

8、informationretrievaltechnologyresearch,byexpandingtheuser'sinitialquerytosolve”querywordsnotmatching”problem,hasimportanttheoreticalsignificanceandpracticalvalue.Thispapermainworkincludes:(1)Thispaperintroducesitsresearchbackground,incl

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。