seo是什么与搜索引擎原理

seo是什么与搜索引擎原理

ID:5401503

大小:605.00 KB

页数:32页

时间:2017-11-10

seo是什么与搜索引擎原理_第1页
seo是什么与搜索引擎原理_第2页
seo是什么与搜索引擎原理_第3页
seo是什么与搜索引擎原理_第4页
seo是什么与搜索引擎原理_第5页
资源描述:

《seo是什么与搜索引擎原理》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、SEO是什么与搜索引擎原理作者:罗义杰沈阳SEOwww.luoyijie.com目录1、SEO的含义2、SEO常见方向3、Spider4、内容处理、中文分词和索引5、页面去重原理6、用户需求分析7、内容相关性计算8、连接分析9、用户体验判断10、有效索引和缓存机制11、反作弊和人工干预沈阳SEOwww.luoyijie.com1、SEO的含义SEO原始定义搜索引擎优化,指为了提升网页在搜索引擎自然搜索结果中的收录数量及排序位置而做的优化行为,这一行为的目的,是为了从搜索引擎中获得更多的免费流量,以及更好的展现网站形象。SEO现实含义还需要

2、对搜索流量在网站中整个行为(PV和转化)负责。沈阳SEOwww.luoyijie.com思考SEO是忽悠还是技术,策略还是艺术?面试官问“你认为SEO是什么?”沈阳SEOwww.luoyijie.com2、SEO常见方向原始方向发发外链,写写文章,堆堆关键词现实方向技术,产品,运营沈阳SEOwww.luoyijie.com搜索引擎原理互联网Spider内容处理分词索引去重反作弊内容相关性链接分析用户体验查询分析缓存机制页面排序沈阳SEOwww.luoyijie.com搜索引擎原理搜索引擎主动抓取网页进行的流程和机制1、派出Spider,按

3、照一定策略把网页抓回到搜索引擎服务器用户进行查询后,搜索引擎工作流程和机制2、对抓回的网页进行链接抽离、内容处理,消除噪声、提取该页面文本内容3、对网页的文本内容进行中文分词、去除停止词4、判断该页面内容与已索引网页是否重复,剔除重复页,对剩余网页进行倒排索引,然后等待用户检索1、对用户所查关键词进行分词,并根据用户地理位置和历史检索特征进行用户需求分析2、查找缓存中是否有该关键词的查询结果,如果有,搜索引擎会根据当下用户的各种信息判断其真正需求,对缓存中的结果进行微调或直接呈现给用户3、如果用户查询的关键词在缓存中不存在,那么就在索引库

4、中的网页进行调取排名呈现,并将该关键词和对应的搜索结果加入到缓存中4、网页排名是根据用户的搜索词和搜索需求,对索引库中的网页进行相关性、重要性(链接权重分析)和用户体验的高低进行分析所得出的沈阳SEOwww.luoyijie.com3、SpiderSpider也就是大家常说的爬虫、蜘蛛或机器人,是处于整个搜索引擎最上游的一个模块,只有Spider抓回的页面或URL才会被索引和参与排名首先,Spider想要抓取网页,要发现网页抓取入口,所以要给Spider一些网页入口,然后顺着入口进行爬行抓取,这就涉及抓取策略问题其次,网页内容是有时效性的

5、,所以Spider对不同网页的抓取频率也要有一定的策略性,这就涉及再次抓取和更新策略问题再次,互联网中的网页总有一部分是没有外部链接导入的,也就是常说的“暗网”并且这部分网页也是需要呈现给网民浏览的,这就涉及如何解决暗网问题最后,大型搜索引擎的Spider不可能只有一个,为了节省资源,要保证多个Spider同时作业且抓取页面不重复,这就涉及分布抓取策略沈阳SEOwww.luoyijie.com3.1Spider分类批量型Spider增量型Spider垂直型Spider有明显的抓取范围和目标,设置抓取时间限制、抓取数据量的限制,或抓取固定范

6、围内页面的限制没有固定目标、范围和时间限制,会无休止地抓取下去直到把全网的数据抓完为止只对特定主题、特定内容或特定行业的网页进行抓取,一般都会聚焦在某一个限制的范围内进行增量型的抓取沈阳SEOwww.luoyijie.com3.2Spider的抓取策略Spider眼中的互联网页面已经抓取过的页面待抓取的页面可抓取的页面暗网中的页面123456789已抓取页面待抓取页面可抓取页面暗网中页面沈阳SEOwww.luoyijie.com3.2Spider的抓取策略Spider的抓取方式深度优先策略广度优先策略即一条道走到黑,当沿着一个路径走到无路

7、可走时,再返回来走另一条路Spider在一个页面上发现多个连接时,先把这些页面抓一遍,然后再抓这些页面中提取下来的链接其他策略重要页面优先抓取策略大站优先策略沈阳SEOwww.luoyijie.com3.2Spider的抓取策略A1234567891011121314A1234567891011121314深度优先策略广度优先策略沈阳SEOwww.luoyijie.com3.3Spider再次抓取更新策略用户体验历史更新频率网页类型搜索引擎会搜集所有用户的搜索请求,然后统计所有搜索结果中用户可能看到的网页,继而进行优先再次抓取和更新。Sp

8、ider的再次抓取就是为了发现已经被索引网页是否有变化,如果某个网页持续没有变化,搜索引擎就会降低对其抓取的频率不同的网页类型有不同的更新频率网页权重网页权重是决定抓取频率的重要因素沈阳SEO

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。