网络搜索引擎76223

网络搜索引擎76223

ID:14927357

大小:83.50 KB

页数:5页

时间:2018-07-31

网络搜索引擎76223_第1页
网络搜索引擎76223_第2页
网络搜索引擎76223_第3页
网络搜索引擎76223_第4页
网络搜索引擎76223_第5页
资源描述:

《网络搜索引擎76223》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、《信息存储与检索》课程实验报告开课实验室:年月日学院年级、专业、班姓名成绩课程名称信息存储与检索实验项目名称网络搜索引擎指导教师教师评语教师签名:年月日一、实验目的掌握网络检索的主要工具(特别是Google)的基本使用方法、技巧和步骤,采集并了解网络搜索引擎的工作原理,采集并了解Google公司的发展历史、技术进展与企业经营战略和企业文化。二、实验步骤利用搜索引擎了解百度或谷歌的基本使用方法利用搜索引擎查找搜索引擎的工作原理了解网络搜索引擎的架构利用网络搜索引擎了解本虚拟企业的发展状况归纳实验、分析实验并写成实验报告三、实验结果及分析使用方法和技巧、步骤:Google的检

2、索工具栏功能强大,有拖放和右击检索功能,新闻阅读,广告拦截,网站排名显示和搜索字词标明等,工具栏可以附在浏览器下,使用更加方便。用户可以首先在Google网站下载并安装一个检索工具栏,然后根据需要在工具栏的选项中进行设置,我们推荐用户使用这个检索工具栏,它将给用户带来许多意想不到的方便。Google通过对Web链接结构和许多其它变量自动计算,对网页的重要程度进行评定。网站排名根据这个评定能够显示用户正在访问的网站的重要程度,用一根绿色线条显示,直观而明确。搜索字词标明通过鲜艳的色彩标明用户所检索的字词在每个网页上的位置,便于用户查阅,单击“搜索字词标明”按钮可以打开和关闭

3、标明状态。拖放检索功能使检索更为方便,用户可以把在网页上所选取的字词直接拖放到检索框中,Google会自动进行检索。对于与Web浏览器同时运行的许多文字处理应用程序中的文字,也可以使用此功能。右击检索是指用户可以在网页上选取文字后,右击鼠标,然后从弹出式菜单中选择“Google搜索”便可以自动检索。搜索引擎的工作包括如下三个过程:1.在互联网中发现、搜集网页信息;2.对信息进行提取和组织建立索引库;3.再由检索器根据用户输入的查询关键字,在索引库中快速检出文档,进行文档与查询的相关度评价,对将要输出的结果进行排序,并将查询结果返回给用户。搜索引擎的工作原理:全文搜索引擎从

4、网站提取信息建立网页数据库的概念。搜索引擎的自动信息搜集功能分两种。一种是定期搜索,每隔一段时间,搜索引擎主动派出“蜘蛛”程序,对一定IP地址范围内的互联网站进行检索,一旦发现新的网站,他会自动提取网站信息和网址加入自己的数据库。另一种是提交网站搜索,即网站拥有者主动向搜索引擎提交网址,它在一定时间内定向向你的网站派出“蜘蛛”程序,扫描你的网站并将有关信息存入数据库,以备用户查询。当用户以关键词查找信息时,搜索引擎会在数据库中进行搜寻,如果找到与用户要求内容相符的网站,便采用特殊的算法——通常根据网页中关键词的匹配程度,出现的位置/频次,链接质量等——计算出各网页的相关度

5、及排名等级,然后根据关联度高低,按顺序将这些网页链接返回给用户。目录索引:首先,搜索引擎属于自动网站检索,而目录索引则完全依赖手工操作。其次,搜索引擎收录网站时,只要网站本身没有违反有关的规则,一般都能登录成功。而目录索引对网站的要求则高得多,有时即使登录多次也不一定成功。最后,搜索引擎中各网站的有关信息都是从用户网页中自动提取的。Google公司的发展历史:google搜索项目是由二名斯坦福大学的理学博士生拉里•佩奇和谢尔盖•布林在1996年早期建立的,他们开发了一个对网站之间的关系做精确分析为基础的搜寻引擎,他的使用结果上胜于当时使用的基本搜索技术。当时项目被称作ba

6、ckrub因为系统需要检查backlinks去估计站点的重要性。google搜索引擎以它简单,干净的页面设计和最有关的搜寻结果赢得了因特网使用者。广告被以关键字的形式出售,以便他们只对感兴趣是最终使用者出现,而且,为了要使页面设计不变而且快速,广告是以文本的形式出现的。这种以关键字卖广告概念本来是overture开发的(即原来的goto.com)。当大部份的网络公司倒下时,google则一直安静地在稳步发展着并开始盈利。2007年10月29日,google公司在中国向二六五网络公司以约2千万美元的价格购得网域名称“g.cn”,成为史上最短的网域注册名称。技术进展:由于搜索

7、引擎有大量的用户,有很好的经济价值,所以引起了世界各国计算机科学界和信息产业界的高度关注,目前的研究、开发十分活跃,并出现了很多值得注意的动向。 目前国内搜索引擎对潜在价值的开发明显不够,在应用上,下一步的发展方向是:网站内和企业局域网内搜索引擎的普及化;实时新闻检索(包括新闻订阅、监控、定向情报收集等)的广泛应用;搜索引擎统计数据的应用;搜索引擎收费登录服务。搜索引擎已成为一个新的研究、开发领域。因为它要用到信息检索、人工智能、计算机网络、分布式处理、数据库、数据挖掘、数字图书馆、自然语言处理等多领域的理论和技术,所以具有综

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。