八爪鱼图片采集攻略

八爪鱼图片采集攻略

ID:8984898

大小:1.93 MB

页数:4页

时间:2018-04-14

八爪鱼图片采集攻略_第1页
八爪鱼图片采集攻略_第2页
八爪鱼图片采集攻略_第3页
八爪鱼图片采集攻略_第4页
资源描述:

《八爪鱼图片采集攻略》由会员上传分享,免费在线阅读,更多相关内容在应用文档-天天文库

1、八爪鱼采集软件批量图片采集攻略瀑布流网站、AJAX网页等技术和网站技术架构和网页结构都与以往传统的网站有所区别,如何对这类型网站进行网页数据采集,下面,本文就来详细介绍下,这类型网站时使用八爪鱼采集器的详细操作步骤。以“东大门”这个站为采集范例,来说明下图片采集要如何实现。先来看下这个网站的特殊之处,首先,页面上的图片不是一次加载完成,而需要滚动多次才会滚动到底部,这类型的网站像新浪微博也是类似情况,当然也有的瀑布流网站是一直加载无法见底的,这个情况另外介绍。其次,产品详情页不能通过点击标题进入,而需要点击图片才能进入。针对以上两点问题,在使用八爪鱼采集器采集图

2、片等信息的时候,在设置规则的时候需要注意以下几点:1、打开网页的时候,需要设置AJAX网页加载,以便确保数据采集的时候不会遗漏,像东大门这个示范站,我们实际滚动大约需要4次,所以我们在AJAX加载到底部,滚动次数可以设置为4次或5次均可,次数可以适当的比实际的滚动次数稍微多一两次!2、由于我们采集时需要点击图片才能进入到产品详情页,在建立元素循环列表的时候,需要将图片链接设置为列表项,如下图所示,我们需要点击A标签取到图片的链接地址,并以此链接为循环列表,添加元素到列表的时候,每次都需要点击A标签,2-3次添加之后系统会将所有选中的图片链接自动读取出来。1、采集

3、图片的URL,按第二步的操作进入到详情页后,就是提取数据了,对于产品名称和价格,都是文本形式,提取非常简单,而对于图片,会需要先采集到图片本身的URL,再进行转换,采集办法如下图所示,选中图片后,在弹出的对话框中可选中IMG标签,选择图片的超链接进行采集。1、设置完成后,保存,来看下采集的战果!URL、产品名称、价格均已采集下来,我们导出为EXCEL格式的文件。2、将图片的URL转换为图片批量下载下来,相关的工具再八爪鱼数据采集器论坛可以免费下载。将URL地址导入工具即可将图片转换下来!经过以上简单的5步,AJAX网页上的瀑布流图片就采集下来了,当然,如果你要进

4、行多页采集,只需要再第2步的设置一次翻页循环即可,翻页循环的相关视频教程可直接点此查看。有关八爪鱼采集软件更多的使用规则,可以直接登陆软件客户端内的规则市场搜索。

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。