第五章计算机检索技术.ppt

第五章计算机检索技术.ppt

ID:48535816

大小:187.00 KB

页数:39页

时间:2020-01-23

第五章计算机检索技术.ppt_第1页
第五章计算机检索技术.ppt_第2页
第五章计算机检索技术.ppt_第3页
第五章计算机检索技术.ppt_第4页
第五章计算机检索技术.ppt_第5页
资源描述:

《第五章计算机检索技术.ppt》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、第五章计算机信息检索的基本技术与方法一、计算机信息检索的基本技术: 布尔逻辑、截词检索、字段检索,位置算符等。在进行计算机检索时,有时有一些比较复杂的课题,如:“GPS在建筑中的应用”,既涉及GPS,又涉及建筑,还有“应用”,这时候就要编制出满足要求的计算机检索式,它是机检的基础。1布尔逻辑检索 (BooleanLogicRetrieval)逻辑检索的基础是逻辑运算,逻辑运算中最常用的是布尔逻辑运算符(BooleanLogicOperators),即与、或、非三种运算符号,用它们可以表示概念之间的逻辑关系。检索要求逻辑检索课题表达式检索结果概念相交、限定AND与*计算机用

2、于制图ABAANDB A*B缩小检索范围 提高查准率概念平行、并列OR或+土地管理与土地利用ABAORBA+B扩大检索范围 提高查全率某一主题去掉一部分相关主题NOT非-除光电测距以外的A电磁波测距BBNOTAB-A提高查准率布尔逻辑 (BooleanLogic)“与”(“AND”)、“或”(“OR”)、“非”(“NOT”)AandBandCAorBorCAandBnotC2位置算符(ProximityOperators)位置算符是表示检索词之间位置关系的一种运算符。由于英文对一句话有多种表达方法,写法可能不同。如:“GPS在铁路桥研究中的应用”这个课题,用英文表达可能是

3、“UsingofGPSinRailwayBridge”,也可能是“UsingofGPSinBridgeofRailway”,因而可能编制出这样的检索式,GPSAND(Railway(2N)Bridge)我们可以通过位置检索提高检索的准确率以Dialog系统为例:(1)(W)算符与(nW)算符W是word与with的缩写。 特点:W词序不变,中间不可插词,但两词间可有一个标点,连字符或空格。nW词序不变,中间可插入N个词。 如:potential(w)energy可能检出potentialenergyandfunction又如:gone(2w)wind可能检出gonewit

4、hthewind(2)(N)与(nN)算符N是near的缩写特点:N词序不限,中间不可插词,但两词间可有一个标点,连字符或空格。nN词序不限,中间可插入N个词。 如:econom??(2N)recovery可能检出economicrecovery,recoveryoftheeconomy,(3)同字段检索A(F)B,F是field的缩写。 特点:A、B两词必须出现在同一字段中,词序与词量不限。 如:environment(F)impact/DE,表示两个词必须同时出现在叙词字段内。(4)同句检索A(S)B,S是sentence的缩写。 特点:A、B出现在同一自然句中(子字

5、段),其词序与词量不受限制。 如:electric(S)plant可检出electricpowerplants如:EI中的NEAR;PQDD中的W/n(两词间距小于n个单词,且前后位置任意),Pre/n(两词间距小于n个单词,且前后位置一定)3截词算符(Truncatingoperators)在英语词汇中,一个词可能有多种形态,如词的单、复数形式的不同,英美拼写方法不同、词性不同等。如果检索时将这类词全部输入进去,会增加检索时间和费用,采用截词法可解决这一问题。所谓截词检索,是指在检索标识中保留相同的部分,用相应的截词符代替可变化部分。检索中计算机会将所有含有相同部分标识

6、的记录全部检索出来。常用“?”、“*”符号表示。(1)有限截词。即在检索词后后截几个有限的字母,如名词的单复数,动词的词尾变化等。 如输入computer??表示有0-1个字母变化,可检出computer和computers.输入stud???表示截断处有0-3个字母变化,可检出study,studies,studied,studing.(2)无限截断:在检索词后加一个“?“,表示该词后可加任意个字符。使用无限截词,所截词根不能太短,否则会输出许多无关文献,造成误检。如:computer?可检出computers,computering,computered,comput

7、erization.(3)中间截断:在检索词中间加一个或几个?号,主要解决一些英美拼写不同,单复数形式的不同的词的输入,可简化输入。 如:输入wom?n可检出woman,women各种算符在数据库中的实际应用位置算符1)EINEARBridgeNEARPiling*表示这两个词要彼此接近,前后顺序不限。W/nPig*W/2pine*表示两个词的距离不能超过n个单词AdjChanneladjtunnel表示含有这两个词,两个词相邻,位置一定2)ISIProceedings用同句算符(SAME):如Channelsametunne

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。