搜索引擎原理

搜索引擎原理

ID:27455487

大小:9.52 MB

页数:48页

时间:2018-12-03

搜索引擎原理_第1页
搜索引擎原理_第2页
搜索引擎原理_第3页
搜索引擎原理_第4页
搜索引擎原理_第5页
资源描述:

《搜索引擎原理》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、第五章WWW经济信息搜索5.1利用搜索引擎检索5.2利用WWW专业经济信息网站检索5.1利用搜索引擎检索5.1.1利用通用搜索引擎检索�搜索引擎类型有:�目录网站式搜索引擎 �全文式搜索引擎 �元搜索引擎目前目录网站和全文搜索是相互融合渗透的如Yahoo默认采用Google的搜索引擎提供页面搜索; Google采用“OpenDirectory”目录提供分类查询�元搜索引擎Highway61(http://www.highway61.com)  Highway61是并行式元搜索引擎,可以 同时调用A

2、ltaVista、Excite、Infoseek、 Lycos、WebCrawler、Yahoo6个独立引 擎,并将它们传回的结果进行排序,显示给 用户。Mammahttp://www.mamma.com万纬搜索http://www.widewaysearch.com�搜索引擎原理搜索引擎品种繁多、功能不一,但是总 体结构和基本工作原理是相同的。每个 搜索引擎都有三个部分组成:(1)采集信息的“机器人”;(2)对采集到的信息进行索引并建立索引库的索引器;(3)完成用户提交查询请求的“检索器”(检索

3、界面)。ServerSideClientSide資料來源:http://computer.howstuffworks.com/search-engine1.htm�搜索引擎使用技巧1、使用多个关键词,精确检索結果�关键词愈明确,搜尋結果愈精确电影行动目标希特勒2004年诺贝尔文學獎得主�平均輸入1.5个关键词太少�5W1HWhat、Who、Where、When、why、How�搜索引擎使用技巧2、要“加”不要“减”,結果更相关�要“+”�臥虎藏龍�臥虎藏龍�電視劇�臥虎藏龍�+電視劇�+電影�臥虎

4、藏龍�+電視劇�+電影�-音樂 �+clinton+lewinsky�不要“-”输入的关键词一定不可以出现在結果中�臥虎藏龍�-音樂�+clinton–lewinsky�知識管理-site:.com�搜索引擎使用技巧3、词组查询加引号“”�PhraseSearching�“knowledgemanagement”�“行动目标希特勒”�“思考的技术”�高级检索中:包含完整的字句�专有名詞�字詞順序前后一致�搜索引擎使用技巧4、限定查询范围結果更精确�语言:進階搜尋>查詢網頁語言偏好設定�网域:只在.

5、edu.tw.gov.tw.com.CN�日期:过去3月、6月、一年、任何時間�文献类型:只在或去除.ppt.pdf.doc�分类:网页目录、GoogleDirectory使用高级检索完成限制  �搜索引擎使用技巧5、指定字段(FieldSearching)如:�title:knowledgemanagement�title:“knowledgemanagement”�title:”knowledgemanagement”–site:.com以Google为例,语法搜索功能有:(1)对搜索的网站进

6、行限制,“site:指令”  注意:site后的冒号为英文字符,而且,冒号后不能有空格。网站域名不能有“http”以及“www”前 缀,也不能有任何“/”的目录后缀。例如:site:edu.cn数据库(2)查询某一类文件,“filetype:”。搜索:艺术filetype:ppt(3)“Link”搜索指向某个网站或页面的所有链接如:link:http://www.sytu.edu.cn/(4)“Allintitle”和“intitle”如:intitle:金融(5)“stock:”用于查阅股票信息

7、(6)google的“更多”选项学术搜索   专门针对www上来自学术著作出版商、专业性社 团、预印本、各大学及其他学术组织的经同行评 论的文章、论文、图书、摘要和文章进行搜索。 此服务的排序考虑到每篇文章的全文内容、作者 影响度、发表文章刊物权威性,以及该文章被 其他学术著作引用的次数等要素,对学术研究来 说很有价值。百度的文档搜索:5.1利用WWW门户搜索引擎�中国科学院国家科学图书馆——服务项目社会科学网络资源导航http://www.las.ac.cn/�CALIS重点学科网络资源导航门户

8、�经济学方面的专业搜索引擎�经济学方面的专业搜索引擎(1)intute(http://www.intute.ac.uk/)intute是英国七所大学合作构建的网络资源检索 服务平台,其前身是英国资源发现网络(United KingdomResourceDiscoveryNetwork,简称 RDN),整合了Altis、Artifact、BIOME、EEVL、 GEsource、Humbul、PSIgate、SOSIG八个非常 有名的学科信息资源门户,分为科学技术、人文艺 术、社会科

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。