现代信息检索技术

现代信息检索技术

ID:5422268

大小:6.56 MB

页数:58页

时间:2017-11-11

现代信息检索技术_第1页
现代信息检索技术_第2页
现代信息检索技术_第3页
现代信息检索技术_第4页
现代信息检索技术_第5页
资源描述:

《现代信息检索技术》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、第0讲课程简介Aboutthecourse2011/9/14提纲2什么是信息检索?为什么要学习信息检索?课程情况提纲3什么是信息检索?为什么要学习信息检索?课程情况从几个互联网应用说起……4搜索引擎中科院研究生院2011年度秋季课程5中科院研究生院2011年度秋季课程6中科院研究生院2011年度秋季课程7三个应用例子的共同特征给定需求(或者是对象),从信息库中找出与之最匹配的信息(或对象)Google的例子:需求“现代信息检索”卓越-亚马逊的例子:对象“天王表-石英女表LS3522S(黑色)”世纪佳缘网的例子:对象“你自己”!8信息检索给定用户需求返回满足该需求信息的一门学科。通常涉及信息

2、的获取、存储、组织和访问。从大规模非结构化数据(通常是文本)的集合(通常保存在计算机上)中找出满足用户信息需求的资料(通常是文档)的过程。“找对象”的学科,即定义并计算某种匹配“相似度”的学科。9信息检索技术的应用10搜索推荐挖掘IR技术情报处理内容安全舆情分析信息检索应用系统搜索系统Web搜索引擎IBMWaston问答系统……推荐系统淘宝网豆瓣网当当网11从信息规模上分类个人信息检索:个人相关信息的组织、整理、搜索等。桌面搜索(DesktopSearch)、个人信息管理(PIM=PersonalInformationManagement)、个人数字记忆(PersonalDigitalMe

3、mory)企业级信息检索:在企业内容文档的组织、管理、搜索等。内容管理(ContentManagement)Web信息检索:在超大规模数据集上的检索。中科院研究生院2011年度秋季课程12提纲中科院研究生院2011年度秋季课程13什么是信息检索?为什么要学习信息检索?课程情况市场发展的需求用户需要信息检索技术:互联网的信息量太大、噪音太多,寻找所需要的信息非常不容易公司需要信息检索技术:搜索引擎改变了很多传统的生活方式,Yahoo、Google、Baidu,还有一些公司如Microsoft、Sina、Sohu、Tecent、Netease都加入到这个搜索技术的竞争。不只是搜索引擎才需要信息

4、检索技术,电子商务(如亚马逊网站、阿里巴巴)、社交网(微博、Facebook、twitter、校内网)、数字图书馆、大规模数据分析等都需要信息检索技术人才的竞争:搜索相关人才人数出现缺口,他们非常抢手,待遇如日中天是不是泡沫:2000年左右出现的网络泡沫和现在的互联网有什么不同,搜索引擎在其中占什么位置?14几个应用需求移动搜索产品搜索专利搜索广告推荐消费行为分析网络评论分析SEO营销……15对相关专业研究生的基本要求信息检索技术是内容应用特别是互联网内容应用的核心技术,可以说在这些应用中无处不在信息检索将会成为一门计算机专业的基础学科搜索(狭义的信息检索)的三个层次(个人观点)16中科院

5、研究生院2011年度秋季课程17应用层次:搜索是一项非常重要的应用!中科院研究生院2011年度秋季课程18中间层次:搜索是极其重要的API中科院研究生院2011年度秋季课程19www.Googlefight.com中科院研究生院2011年度秋季课程20介绍一本有趣的书!中科院研究生院2011年度秋季课程21核心层次:搜索是未来操作系统的重要组成部分!提纲22什么是信息检索?为什么要学习信息检索?课程情况课程的宗旨信息检索的基本原理、模型和方法(含部分机器学习、自然语言处理方法)信息检索系统的基本实现方法如何进行(信息检索)研究选题、查找文献、读论文、做实验、写论文、作报告等等23老师介绍(

6、1)主讲老师:王斌,中科院计算所博士毕业,副研究员,博士生导师。现为中科院计算所前瞻研究实验室信息检索课题组负责人。http://ir.ict.ac.cn/~wangbin/wangbin@ict.ac.cn新浪微博:计算所王斌http://weibo.com/wang2bin1办公电话:6260135024老师介绍(2)助教:中科院研究生院2011年度秋季课程25本课程的特点不是教学生学怎么使用信息检索工具(另有课程),而是了解信息检索工具背后的基本原理和技术,并且能够进行深层的研究或开发相关的应用。知其然知其所以然。基本原理+广泛实践26授课内容简介(传统角度总结)信息检索的基本概念信

7、息检索的评价信息检索模型和算法模型(布尔模型、向量模型、概率模型、语言模型)相关反馈、查询扩展文本处理技术文本分类和聚类技术(倾向性分析)信息过滤技术信息组织和索引并行和分布式检索信息检索的应用WEB检索27授课方案课堂讲述和课后练习相结合讲授内容既包含传统内容,也注意吸收最新研究成果学术内容和业界进展相结合既考虑一般学生普及入门的需求,也考虑相关专业学生更高的要求尽量用简单而风趣的语言、形象而逼真的例子进行讲授28课程

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。