信息检索原理与检索语言

信息检索原理与检索语言

ID:41530056

大小:342.01 KB

页数:22页

时间:2019-08-27

信息检索原理与检索语言_第1页
信息检索原理与检索语言_第2页
信息检索原理与检索语言_第3页
信息检索原理与检索语言_第4页
信息检索原理与检索语言_第5页
资源描述:

《信息检索原理与检索语言》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、第三章社科信息检索原理与技术第一节信息检索原理与检索语言第二节信息检索技术第一节信息检索原理与检索语言ThePrinciplesandLanguageofInformationRetrieval信息检索原理图A.信息存储过程:将大量分散的文献信息搜集起来,根据其内容特征或外表特征进行标引,形成表征这些文献信息的特征标识,并存储在一定的载体上,成为有查询功能的检索工具。B.信息检索过程:用户根据自己的信息需求,提出检索提问,然后使用有关的标引语言(也称检索语言)将拟定的检索提问规范成检索标识,用于检索的过程。1.信息检索原理简言之,

2、信息检索原理就是用户将信息需求转变为检索系统所能识别的检索标识,与信息检索系统中存储的信息特征进行逐一比对,两者完全一致或基本一致时,即为检索命中信息,可按用户要求从检索系统中输出。其检索结果既可能是用户需要的最终信息(一次信息),也可能是用户需要的信息线索(二次信息),用户可据此线索进一步进行判断、筛选,以获取所需要的最终信息。概念:信息检索语言就是信息组织和信息检索时所使用的语言(包括自然语言)。信息检索语言是文献信息标引的规则和标准,标引人员可用它来标引文献以便将文献整理、加工、存储于检索系统中,同时,检索人员可用它来表达检

3、索课题信息的内容,以便把特定文献从检索系统中检索出来。因此,检索语言就是一种把文献的存储与检索联系起来,把标引人员和检索人员沟通起来的约定人工语言。2.信息检索语言功能:①对文献的信息内容及其外表特征加以规范化的标引②对内容相同及相关的文献信息加以集中或揭示其相关性③可使文献信息的存储集中化、系统化、组织化,便于用户按一定的排列次序进行有序化检索。④便于将标引用语和检索用语进行相符性比较例如:有三篇文献篇名如下:文献1:AModelofmultimediainformationretrieval文献2:TheInformation

4、retrievalinchemistryWWWserver文献3:ERICresources在对信息存储的过程中,对这三篇文献内容分别进行了分析,并使用检索语言对其进行标引,标引结果为:文献1:篇名(title):AModelofmultimediainformationretrieval主题(subject):informationretrieval,multimediacomputerapplications文献2:篇名(title):TheInformationretrievalinchemistryWWWserver主题(

5、subject):chemistry,educationalmaterials文献3:篇名(title):ERICresources主题(subject):educationalmaterials标引后这三篇文献分别被存储进数据库。在信息检索过程中:如果用户输入“informationretrieval”一词,并将检索范围限定在篇名中,则文献1与文献2符合用户要求,成为检索结果。如果用户输入“informationretrieval”一词,并将检索范围限定在主题中,则只有文献1符合用户要求,成为检索结果如果用户输入“educati

6、onalmaterials”一词,并将检索范围限定在主题中,则文献2和文献3符合用户要求,成为检索结果。在上述例子中,“informationretrieval”、“educationalmaterials”都是检索语言,篇名和主题则是检索语言的标识,检索系统就是通过他们将用户需求与信息内容进行运算匹配,最终找到检索结果的。由这个例子可以看出,检索语言的主要作用就是对文献的外部特征和内容进行多层次描述,提供多种检索途径,以方便用户从不同角度检索查找。(1)分类检索语言文献分类的实质是按照知识体系分类和概念逻辑的方法,对文件的信息进

7、行区分和归类。分类语言的词表即为分类表,它是由众多类目按照一定的知识分类和概念逻辑秩序,并考虑文献分类的需要而构成的体系。其中,类目是组成分类语言的基本单元,每一个类目都是一个相同事物构成的集合,体现单一的概念意义或复合的概念意义,表达这些概念意义的自然语言词语为类目名称或类名。2.1检索语言的分类由于分类语言通常采用字母或数字符号来构词,因而表达这些概念意义的分类语言词语就是类目的号码,即类号,通过自然语言的类名,可以直接的理解类目的含义,借助形势化符号的类号,可以系统的揭示与组织文献信息。 文献分类的意义在于,根据文献信息

8、的内容特征和分类词表,把相同内容的文献集中起来,同时,又把不同内容的文献信息区别开来,以实现相关集中的功能。分类检索语言的类型有:(1)体系分类法 (2)组配分类法 (3)混合式分类法使用较多的是体系分类法,其主要特点是按学科、专业集中文献,并从

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。