信息检索之检索语言.ppt

信息检索之检索语言.ppt

ID:51128590

大小:415.81 KB

页数:27页

时间:2020-03-18

信息检索之检索语言.ppt_第1页
信息检索之检索语言.ppt_第2页
信息检索之检索语言.ppt_第3页
信息检索之检索语言.ppt_第4页
信息检索之检索语言.ppt_第5页
资源描述:

《信息检索之检索语言.ppt》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、信息检索的原理4、分类语言的依据和特征,课题概念分类的方法。5主题检索语言和关键词检索语言的主要区别是什么?6、什么是数据库?文献型数据库的结构7、布尔逻辑检索有哪几种,其功能是什么?分类语言的依据和特征,课题概念分类的方法。检索语言分类语言关键词叙词主题语言检索语言是应文献信息的加工、存储和检索的共同需要而编制的专门语言,是表达一系列概括文献信息内容和检索课题内容的概念及其相互关系的一种概念标识系统。什么是检索语言?什么是分类语言?分类语言也称分类法。用分类号和相应的分类款目来表达各种概念,以学科体系为基础将各种概念按学科性质和逻辑层次结构进行分类和系统排序,能反映事物的从属派生关系,便于按

2、学科门类进行族性检索。按照分类方式的不同,分类语言又分为体系分类语言、组配分类语言和混合分类语言。分类语言的依据中国分类法专利分类法标准分类法中国分类法标准分类法A综合……………………………………00/09标准化管理与一般规定10/19经济、文化20/39基础标准40/49基础学科50/64计量65/74标准物质75/79测绘B农业林业………………………………00/09农业、林业综合10/14土壤与肥料15/19植物保护20/29粮食与饲料作物30/39经济作物40/49畜牧50/59水产、渔业分类语言的特征1.表达文献外部特征的检索语言2.表达文献内部特征的检索语言(一)表达文献外部特征的检

3、索语言表达文献外部特征的检索语言主要是指文献的篇名(题目)、作者姓名、出版者、报告号、专利号等。将不同的文献按照篇名、作者名称的字序进行排列,或者按照报告号、专利号的数序进行排列,所形成的以篇名、作者及号码的检索途径来满足用户需求的检索语言。描述文献外表特征的检索语言可简要概述为:题名、著者、文献编号等索引。(二)表达文献内部特征的检索语言1.分类语言分类语言是指以数字、字母或字母与数字结合作为基本字符,采用字符直接连接并以圆点(或其他符号)作为分隔符的书写法,以基本类目作为基本词汇,以类目的从属关系来表达复杂概念的一类检索语言。以知识属性来描述和表达信息内容的信息处理方法称为分类法。课题概念

4、分类单概念课题多概念课题上位类分类法主题检索语言和关键词检索语言的主要区别是什么?主题词与关键词最大的区别就是主题词经过了规范化处理。主题词是规范化的检索语言,它对文献中出现的同义词、近义词、多义词以及同一概念的不同书写形式等进行严格的控制和规范,使每个主题词都含义明确,以便准确检索,防止误检、漏检。如:白介素2、白细胞介素2、IL2、IL-2等表达同一概念的不同书写形式规范为“白细胞介素2”。。主题词表是对主题词进行规范化处理的依据,也是文献处理者和检索者共同参照的依据。关键词是属于自然语言的范畴,未经规范化处理,也不受主题词表的控制。如:对于“白细胞介素2”这一概念可有白介素2、白细胞介素

5、2、IL2、IL-2等不同形式来表达。      因此,为了达到较高的查准率和查全率,如果检索工具提供了主题词这一检索途径的话就应该选择主题词来进行检索,而不应该选择关键词。例如:利用MEDLINE光盘数据库检索有关“肝肿瘤”方面的文献。MEDLINE光盘数据库既提供了主题词途径,也提供了自由词(关键词)途径。如果选择关键词途径来进行检索,欲达到较高的查准率和查全率,就得查找“livercancer”、“livercarcinoma”、“liverneoplasm”、“livertumor”、“hepaticcancer”、“hepaticcarcinoma”、“hepaticneoplasm

6、”、“hepatictumor”等词,另外还得考虑像cancer、carcinoma、neoplasm、tumor等词还有复数形式;而如果选择主题词途径进行检索就只需查找“liverneoplasms”一词就行了,这一词就包括了以上所提及的不同的表达形式。由此可见,选用主题词途径检索,既能满足较高的查准率、查全率,又能提高检索速度,何乐而不为呢?什么是数据库?文献数据库的结构.数据库的定义数据库是指至少由一种文档组成,能满足特定目的的或特定功能数据处理系统需要的数据集合。在计算机情报检索系统中,多数数据库为关系型数据库。数据库的类型按照数据库所含信息内容的不同,文献数据库可分为文字型、数值型和

7、多媒体型多媒体型数据库是指含有字符、声音、图像信息的数据库。这种数据库一般为超文本结构。他们既可以用于查找相文献信息,也可以用于查找特定的属性值、声音和图像。文字型数据库是指以文字字符为主要记录内容的数据库,包括书目型、事实型、百科全书型、词库型和全文型数据库。这类数据库主要用于查找相关文献信息。数值型数据库包括来自科学研究,原始文献或者调查研究的各种数值型或图表型数据库。这类数据库主要用于查找确

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。