火车头工具使用

火车头工具使用

ID:35620004

大小:791.10 KB

页数:13页

时间:2019-04-03

火车头工具使用_第1页
火车头工具使用_第2页
火车头工具使用_第3页
火车头工具使用_第4页
火车头工具使用_第5页
资源描述:

《火车头工具使用》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、第一步:新建组,如图我们新建的组名为“癫痫”,然后癫痫下边新建任务,如果是癫痫治疗,那么就可以取名为“癫痫治疗”:第二步:开始任务:点开之后选择批量多页,你给的链接我看了,总共有三页,所以选择项数为3,然后在网址选择上第三步,在选择地址格式的时候,注意观察,第一页文章和第二页文章网址有什么不同,将相同的保留,不同的用(*)代替,选取不同的链接用(*)代替,可以直接在后边点击,就自动添加了(*)我们观察后发现,链接地址只有前边的http://health.dbw.cn/sj/dxbdzlff/list_26_是相同的,后边会自动变化,所以链接格式就为http://health.

2、dbw.cn/sj/dxbdzlff/list_26_(*).html,第四步,网址选择完成后,单击添加,完成接下来就是多级网址的获取:(这是采集关键)*第五步:必须包含,任意选取其中一篇文章,提取链接,将不同的用(*)代替。接下来的关键在链接地址选择:打开文章列表页:怎样判断代码源里边是独一无二的代码,ctrl+F查找查看源代码:找出标题列表最上边的独一无二的最接近标题的代码,一般都是divclass=“”这样的格式,标题列表末尾也是同样选取,同样格式,独一无二末尾:选取完成后点击保存完成后先测试网址采集,就在最下边:测试正确完成后点击保存,接下来进行第二大步。第二部分:第

3、一步:采集内容规则内容采集,就比较简单了,任意选取一篇文章,查看源代码:找出标题前后代码:同样代码也是独一无二,双击标题,就可以进入:代码选择完成后确定。接下来就是内容页:同样双击之后查看:内容代码的选择完成后,结果如下:但是注意内容要添加HTML标签排除全选之后将换行和空格勾去确定之后就差不多完成了。你也可以随便找一篇页面文章测试下结果:第三部分:第一步,发布内容设置:文件模板地址:这个地址就看你把文件在那解压的。这就算是全部完成了。接下来就是采集:保存之后,三个全打对勾,开始采集:右键点击,开始任务,完成后只要去你建立的文件夹里边看就可以了。

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。