信息检索第二次课课件

(9页)

'信息检索第二次课课件'
LOGO 信息检索的基本理论 张 峰 今天要解决的问题模 信息、信息资源的相关概念(战争论)拟战 (兵法)信息检索的定义与拆解争法、 (战略)信息检索策略模拟 (战役)信息检索的流程对抗方 信息的描述与检索途径(战术)法 信息的排序与检索方法(战术) 传统检索与计算机检索的关系(战术) Page 2信息、信息资源的相关概念(战争论) n 信息是什么? 本体论:客观事物的性质及其变化; 认识论:人对本体论信息的感知; 价值论:对认识论信息的有用性选择 n 信息有什么用? 认识真理,创造价值=>容易感知、能够创造价值的信息称为“信息资源” n 信息活动中的3个相关概念: 文献:一切信息的载体,信息的客观记载和主观解释 情报:针对特定信息需求的特定信息 知识:正确信息的系统化集合...........不断精炼的3种信息,英文叫refine n 信息为什么要检索? 信息量大、信息复杂 VS 信息需求要求信息:准确、有序 简单的说:就是为了解决存储和需求之间的矛盾 Page 3 信息检索的定义与拆解(兵法)1.检索的字面意义: 检:检查=分辨、查找;索:索取=询问、获取2.检索的规范定义: 根据一定需求、利用特定的工具、采用特定的方法、通过不同 的途径从大量的信息资源中找出并获取所需文献信息的过程 (广义的检索还包括文献信息的表示和存储)=>3.检索的概念拆解: 需求 —> 工具—> 途径 —>方法 —> 信息资源<—序化<—表示<—信 息 战略:知道为什么要干 战役:知道干什么 战术:知道怎么干 Page 4 信息检索策略(战略) 需求 —> 工具—> 途径 —>方法 —> 信息资源<—序化<—表示<—信息1。(上游)明确需求:查新旧、查真假、查好坏.............具体需求............检全、检准2。(下游)确定信息资源(的范围):寻找对应可能含有所需信息的信息资源3。(中间)走流程(战役):选择工具、选择途径、选择方法 + 实施、评价、调整...............重复流程n 结果输出、整理(属于信息分析范畴) Page 5传统检索与计算机检索的关系(战术1) 需求 —> 工具—> 途径 —>方法 —> 信息资源<—序化<—表示<—信息 n 计算机检索的优点:快、准、多、新、易 n 缺点:用电、用设备、用网、收录不全 n 所以,后面讲信息资源的时候,电子的和非电子的我都会讲,但是从 原理上说,两者没有根本的区别。 Page 6信息的表示与检索途径(战术2) 需求 —> 工具—> 途径 —>方法 —> 信息资源<—序化<—表示<—信息 n 信息的要素:5w1h、pmest、FRBR n 信息要素的表示(描述、标引): (1)工具:元数据(MARC、DC、CIP、ONIX) (2)过程:选择、著录 (3)结果:著录项目(字典、卡片、数据的条目)都是著录项目的集合 => 每一种著录项目对应一种检索途径,可根据需求进行选择: 外部途径:题名、著者...、内部途径:分类号、主题词 * 特殊途径 n 元词法 & 全文检索: n 字段限定 & 字段模糊检索....................多媒体检索、多媒体特征检索 n 截词检索: n 向量空间检索模型 —> 字段组合检索 Page 7信息的序化与检索方法(战术3) 需求 —> 工具—> 途径 —>方法 —> 信息资源<—序化<—表示<—信息 n 标引和序化是不同的过程: 标引反映信息本身的特征、序化反应单个信息在多个信息中的特征 n 信息序化: (1)原理:信息间关系:学科关系、主题逻辑、句法关系、符号体系、 文献关系)。举例:《中图法》《汉语主题词表》《新华字典》 (2)过程:排检法编制、字段选择、排序 (3)结果:信息的有序集合(字顺索引、分类体系、数据库结构...) n 排检法:字顺排检、符号排检、逻辑排检 n 布尔逻辑:and、or、not n 语义检索:自然语言检索的现在和未来 Page 8 思考题又来了1。信息为什么需要检索?2。信息检索的策略、流程、方法?3。信息检索的两种方法 及其衍生方法 在原理上的区别是什么?LOGO 信息检索的基本理论 张 峰 今天要解决的问题模 信息、信息资源的相关概念(战争论)拟战 (兵法)信息检索的定义与拆解争法、 (战略)信息检索策略模拟 (战役)信息检索的流程对抗方 信息的描述与检索途径(战术)法 信息的排序与检索方法(战术) 传统检索与计算机检索的关系(战术) Page 2信息、信息资源的相关概念(战争论) n 信息是什么? 本体论:客观事物的性质及其变化; 认识论:人对本体论信息的感知; 价值论:对认识论信息的有用性选择 n 信息有什么用? 认识真理,创造价值=>容易感知、能够创造价值的信息称为“信息资源” n 信息活动中的3个相关概念: 文献:一切信息的载体,信息的客观记载和主观解释 情报:针对特定信息需求的特定信息 知识:正确信息的系统化集合...........不断精炼的3种信息,英文叫refine n 信息为什么要检索? 信息量大、信息复杂 VS 信息需求要求信息:准确、有序 简单的说:就是为了解决存储和需求之间的矛盾 Page 3 信息检索的定义与拆解(兵法)1.检索的字面意义: 检:检查=分辨、查找;索:索取=询问、获取2.检索的规范定义: 根据一定需求、利用特定的工具、采用特定的方法、通过不同 的途径从大量的信息资源中找出并获取所需文献信息的过程 (广义的检索还包括文献信息的表示和存储)=>3.检索的概念拆解: 需求 —> 工具—> 途径 —>方法 —> 信息资源<—序化<—表示<—信 息 战略:知道为什么要干 战役:知道干什么 战术:知道怎么干 Page 4 信息检索策略(战略) 需求 —> 工具—> 途径 —>方法 —> 信息资源<—序化<—表示<—信息1。(上游)明确需求:查新旧、查真假、查好坏.............具体需求............检全、检准2。(下游)确定信息资源(的范围):寻找对应可能含有所需信息的信息资源3。(中间)走流程(战役):选择工具、选择途径、选择方法 + 实施、评价、调整...............重复流程n 结果输出、整理(属于信息分析范畴) Page 5传统检索与计算机检索的关系(战术1) 需求 —> 工具—> 途径 —>方法 —> 信息资源<—序化<—表示<—信息 n 计算机检索的优点:快、准、多、新、易 n 缺点:用电、用设备、用网、收录不全 n 所以,后面讲信息资源的时候,电子的和非电子的我都会讲,但是从 原理上说,两者没有根本的区别。 Page 6信息的表示与检索途径(战术2) 需求 —> 工具—> 途径 —>方法 —> 信息资源<—序化<—表示<—信息 n 信息的要素:5w1h、pmest、FRBR n 信息要素的表示(描述、标引): (1)工具:元数据(MARC、DC、CIP、ONIX) (2)过程:选择、著录 (3)结果:著录项目(字典、卡片、数据的条目)都是著录项目的集合 => 每一种著录项目对应一种检索途径,可根据需求进行选择: 外部途径:题名、著者...、内部途径:分类号、主题词 * 特殊途径 n 元词法 & 全文检索: n 字段限定 & 字段模糊检索....................多媒体检索、多媒体特征检索 n 截词检索: n 向量空间检索模型 —> 字段组合检索 Page 7信息的序化与检索方法(战术3) 需求 —> 工具—> 途径 —>方法 —> 信息资源<—序化<—表示<—信息 n 标引和序化是不同的过程: 标引反映信息本身的特征、序化反应单个信息在多个信息中的特征 n 信息序化: (1)原理:信息间关系:学科关系、主题逻辑、句法关系、符号体系、 文献关系)。举例:《中图法》《汉
关 键 词:
信息检索第二次课课件 ppt、pptx格式 免费阅读 下载 天天文库
 天天文库所有资源均是用户自行上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作他用。
关于本文
本文标题:信息检索第二次课课件
链接地址: https://www.wenku365.com/p-44789312.html
关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服点击这里,给天天文库发消息,QQ:1290478887 - 联系我们

本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有【成交的100%(原创)】。本站是网络服务平台方,若您的权利被侵害,侵权客服QQ:1290478887 欢迎举报。

1290478887@qq.com 2017-2027 https://www.wenku365.com 网站版权所有

粤ICP备19057495号 

收起
展开