浅析网络搜索引擎

浅析网络搜索引擎

ID:19205953

大小:16.65 KB

页数:6页

时间:2018-09-29

浅析网络搜索引擎_第1页
浅析网络搜索引擎_第2页
浅析网络搜索引擎_第3页
浅析网络搜索引擎_第4页
浅析网络搜索引擎_第5页
资源描述:

《浅析网络搜索引擎》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、浅析网络搜索引擎  伴随着互联网的高速发展,互联网已经渗透到人们生活的各个角落,人们的生活已经离不开互联网,当人们遇到问题时不再是查阅书本,越来越多的人倾向于去互联网寻找答案。有关数据表明,截止到目前,美国Google公司的搜索引擎的索引量已超过41亿。一般来说由于互联网传递的信息数量之大,种类之多,更新速度之快的特点。用户要想从庞杂的信息中找到自己想要的信息实属不易,因此,对搜索引擎进行优化,对信息分类显得很有必要。基于以上问题,有如下措施可以改善,把不同的资源分类,拟定搜索关联盟键词,进而实现智能化搜索,接下来将对以上所提到的改善策略详细说明。  一、网络搜索引擎的性能优化策略和相

2、关技术  就早期的搜索引擎而言,其搜索系统主要由爬行器、索引器、和检索器三部分构成,用户在使用搜索引擎搜索时,搜索结果的准确性往往由以上三部分决定。因此,要想提高搜索引擎的准确性,必须改善爬行器、索引器、和检索器三部分。下文将就如何改善以上三部分做出具体的说明。  权威性  资源的权威性是对资源分类的一个重要参考指标,资源之所以具有权威性是因为其内容和质量长时间内得到了用户的认可,具有相当高的可信度。因此,用户在对资源检索时,必须让这些权威性的资源出现在检索结果前面,让用户一眼就能看见。  同时,判断资源是否具有权威性靠人来判定是不现实的,一方面互联网上资源数量之大,靠人力来评判资源的

3、权威性显然行不通,其次,在评判资源的权威性时,人或多或少的会带有主观性。因此,在评定网络资源的权威性时,建立合理科学的评判标准,让系统自动的评判资源的权威性显得很有必要。由于网络资源的特殊性,实际操作时可以根据资源的来源链接进行分析判断。  关键词  用户在使用搜索引擎搜索答案之前就已经有明确的目标,自己要搜索什么,想得到什么样的搜索结果,所以必须把用户搜索的关键词和有关资源联系起来,并进行判断排序,进而显示在搜索结果里。需要强调的是,这个匹配过程,需要系统在用户搜索过程中迅速收集各种文档,根据有关技术对资源和用户搜索的关键词进行匹配,进而把最优的,符合用户需求的资源排在搜索结果前面。

4、  在对资源和关键词匹配时,比较关键的技术就是自动分类技术。自动分类技术对网络资源分析处理时,主要根据资源的相似性对资源分类,检索式的结果因检索的关键词不同而不同,自动分类技术的好处是用户在输入搜索内容后,得到检索结果之前,搜索引擎就可以快速对用户搜索的关键词和资源进行匹配,重要的是,自动分类技术只对搜索得到的结果进行分类,这样的好处是不仅降低了开发搜索引擎的成本,而且还极大的缩短了搜索时间,提高了搜索的准确率。目前常用的自动分类技术方法有单遍聚类法、逆中心距聚类法。这两种方法有着很大的差别,体现在前者是对资源预先分类,实际操作起来比较复杂,后者操作起来虽然较简单,但由于对资源分类不明

5、确,对资源的关键词匹配没有前者准确。在实际应用时,可根据具体情况来选择不同的分类方法。  个性化  一千个读者有一千个哈姆雷特,同样的问题,由于用户文化水平的参差不齐,对不同的问题有不同的表述方式,因此,在实际检索中即使输入的关键词相同,但不同的用户想得到的搜索结果可能有很大的差别。所以,用户在输入关键词检索时,搜索引擎应该根据用户的不同情况,进而对关键词做出深入的分析,进而匹配用户需要的资源,所以在实际应用中搜索引擎应该具有个性化。  1.用户兴趣模型  要想实现检索的个性化,建立一个适当的模型就很有必要。其中建立模型的关键在于收集用户的检索习惯,对于用户的检索习惯可通过如下两种方法

6、进行收集,首先是给用户选择的权利,让用户选择让他感兴趣的内容。此种方法理论上是非常有效的,但实际操作起来难度特别大。因为实际情况是极少数用户愿意去选择自己感兴趣的内容。其次是根据用户以前的浏览历史和搜索记录来分析用户的喜好,这种搜索方法不需要用户的参与,由系统自动完成,但是对系统的要求比较高,且前提是有一定的用户基数。用户兴趣模型建立之后,当用户搜索时,搜索引擎便通过用户兴趣模型快速对资源匹配,让用户需要的资源显示在搜索结果前面。  2.用户信息反馈  由于用户在检索问题是,对一个问题的描述往往并不准确,但用户发现自己的搜索结果不是自己预期的结果时,往往会对问题重新描述,这个过程通常称

7、为反馈,此时搜索引擎要及时改变资源匹配方法,适应用户的搜索习惯,进而让显示的搜索结果满足用户的需求。当搜索引擎得到用户对搜索结果的反馈后,要迅速重新显示搜索结果,然后再根据用户的反馈,直到得出用户想要的结果。显然用户的反馈是十分重要的,一般而言搜索引擎对用户反馈信息有以下利用方式,首先让用户接下来的搜索结果依赖于用户上一次的反馈信息,显然这是个性化的一种方式,其次让搜索引擎通过用户的反馈信息来改善整个索引结果,进而得到用户想要的搜索结果,这是搜

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。