火车头采集教程火车头采集器使用说明

火车头采集教程火车头采集器使用说明

ID:6368717

大小:4.30 MB

页数:36页

时间:2018-01-11

火车头采集教程火车头采集器使用说明_第1页
火车头采集教程火车头采集器使用说明_第2页
火车头采集教程火车头采集器使用说明_第3页
火车头采集教程火车头采集器使用说明_第4页
火车头采集教程火车头采集器使用说明_第5页
资源描述:

《火车头采集教程火车头采集器使用说明》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、火车头采集教程火车头采集器使用说明上图中,用红线圈住的LocoySpider.exe是主程序,我们双击打开。。。ps:这里说下,上图中,有好多任务是我自己用的。。。新程序,并没有那么多。。。我们会看到火车的界面,看起来非常复杂,是吧?呵呵,其实并没有那么复杂,对于新手,有好多东西是用不到的。。。下边会一一的讲解。。。我们先补习一下,火车头采集软件的工作原理。。。因为我们浏览到的网页,最后都是通过html输出的,那么意味着,我们可以查看到html的源码,那么火车头为什么会采集到内容呢?我们看下网站的基本结构。。。

2、PUBLIC"-//W3C//DTDXHTML1.0Transitional//EN""http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">-------这些蓝色的东西,对于新手,我们不需要知道!网页的标题----红色的是网

3、页的标题。。。如下图(1)内容          在这个和之间的,是网站的内容部分。。如下图(2)----------这里是网站的结尾。。。。如果想查看一个网页的html源文件,之需要点击浏览器上的查看,源文件即可。。。。(1)(2)那么,我们知道了一个网页最基本的架构,那么就好理解火车采集的基本原理了火车采集软件是怎么采集的呢?我们配置好火车头采集规则,什么叫采集规则?就是我们查看网页的源文件,看看整个网页的源码,内容部分的开始标签,和结束标签,这样火车才

4、能知道,我们要采集这个页面的哪个部分,比如下边我们演示的。。。网页的标题<</p><p>5、/title></head><body>内容</body>我们想要采集“内容”那么就要告诉火车采集器,内容开始标签是<body>,结束标签就是</body>明白了么?呃。。。估计是我的表达能力不够好。。。so。。。我们看下边的实例,在好好巩固下就OK。。。OK。。那么我们开始一步一步教大家设置采集规则。。。首先第一个。。我们的目标站。。discuz!x1.5架构的网站。。。http://www.yq90.cn/forum-60-1.html我们要把这个版块的内容以及回复都采集到我们的网站上去。。。首先我们打开火车,新建一个站点。。。点击</p><p>6、火车左上角上的新建按钮,选择新建站点。。。如下图我们只需要填写站点名就可以,其余的保持默认,然后点击保存按钮!然后。。。在这个站点下,新建一个任务。。。选中我们新建的站点,点击鼠标右键,选择第一个,从该站点新建任务。。。如下图其中1,是任务的名字,必须填写。。。2,是整个采集任务的步骤向导,3,是文章列表的设置区域(下边讲解),4,和3差不多。。。5,是登录的地方,有些网址必须登录,我们才可以看到内容,就是这个东西!OK。就这些,那么,我们一步一步的来!首先我们给我们的任务加一个标题。。。下一步,我们就开始设置列表的采集规则(因为现在火</p><p>7、车不知道http://www.yq90.cn/forum-60-1.html这个页面的文章列表是那些,所以我们要告诉火车!)这里有两种方式,新手嘛,我也不知道适合哪种。。。我们就用默认的吧,第一种我们点击向导添加然后出现下图。。其中有4个选项卡,如果我们只采集目标站点的一个文章列表http://www.yq90.cn/forum-60-1.html,那么我们选中单条网址,直接写上目标的列表网站,如下图!然后点击添加,点击完成就OK。。那么,如果我们要采集多个列表。那么我们回到看下边的图其中1,是目标网站的地址其中2,是火车的通配符(就是</p><p>8、某个东西识别的东西)其中3,是间隔数已经补零(下边一一讲解)其中4,数字变化。。。下边讲解其中5,字母变化。。。那么。。。看下图图中在地址栏填写的是http://www.yq90.cn/forum-60-(</p> </div> <div class="mt-3 bg-white"> <div class="d-lg-block d-none px-3 px-lg-4 py-3 border-bottom text-center font-18"> 当前文档最多预览五页,下载文档查看全文 </div> <div class="detail-fixed-feature d-none d-lg-block" id="detailFixedFeatureBox"> <div class="px-3 px-lg-4 py-3 d-flex align-items-center justify-content-between fixed-feature-box" id="detailFixedFeature"> <div class="d-lg-flex d-none align-items-center"> <div> <a class="btn btn-outline-danger article-state" href="javascript:;" data-id="6368717" data-code="438274" data-title="火车头采集教程火车头采集器使用说明"> <span>侵权申诉</span> </a> <button type="button" class="btn btn-outline-secondary with-light ml-2" data-toggle="modal" data-target="#reportModal" data-id="6368717"><span>举报</span></button> </div> <nav class="d-flex align-items-center ml-4" id="anchorPoint"> <a href="javascript:;" class="btn btn-light anchor-pre px-2"><i class="iconfont text-muted"></i></a> <div class="text-muted mb-0 pre-point-list" id="prePointList"> <a class="px-2 active nav-link" href="#anchorImg0">1</a> <a class="px-2 nav-link" href="#anchorImg1">1</a> <a class="px-2 nav-link" href="#anchorImg2">2</a> <a class="px-2 nav-link" href="#anchorImg3">3</a> <a class="px-2 nav-link" href="#anchorImg4">4</a> <a class="px-2 nav-link" href="#anchorImg5">5</a> / <span class="px-2" id="prePageNums">36</span> </div> <a href="javascript:;" class="btn btn-light anchor-next px-2"><i class="iconfont text-muted"></i></a> </nav> </div> <div class="d-flex align-items-center"> <p class="d-lg-block d-none font-14 text-black-50 mb-0 mr-2">此文档下载收益归作者所有</p> <button class="btn btn-danger detail-download-btn px-3 ml-0 font-16" data-btn="downloadfile" style="width:128px;height:40px;" data-id="6368717" data-price="1000" data-size="4.30 MB" data-page="36页" data-type="doc" data-binddown="true" data-isold="new_content" data-vip="0" data-title="火车头采集教程火车头采集器使用说明">下载文档</button> </div> </div> </div> </div> <div class="d-block d-lg-none px-3 px-lg-4 py-3 border-bottom text-center font-14" style="color:#999">当前文档最多预览五页,下载文档查看全文</div> <button class="btn d-block w-100 d-lg-none btn-danger detail-download-btn px-3 ml-0 font-16" data-btn="downloadfile" data-id="6368717" data-price="1000" data-size="4.30 MB" data-page="36页" data-type="doc" data-binddown="true" data-isold="new_content" data-vip="0" data-title="火车头采集教程火车头采集器使用说明">点击下载本文档 </button> </div> <div class="px-3 px-lg-4 py-3 bg-white mt-3"> <ul class="nav custom-tab border-bottom" id="myTab" role="tablist"> <li class="nav-item" role="presentation"> <a class="nav-link active px-0 mr-4 font-16 font-weight-light pb-3" id="tips-tab" data-toggle="tab" href="#showTips" role="tab" aria-controls="showTips" aria-selected="true">版权提示</a> </li> <li class="nav-item" role="presentation"> <a class="nav-link px-0 pb-3 font-16 font-weight-light text-black-50" href="/d-6368717.html" >下载文档</a> </li> <dl class="flex-grow-1 mb-0 d-lg-none"> <li class="ml-3 float-right d-lg-none"> <button type="button" class="btn btn-light" data-toggle="modal" data-target="#reportModal" data-id="6368717"><span>举报</span></button> </li> </dl> </ul> <div class="tab-content with-content pt-3" id="myTabContent"> <div class="tab-pane fade show active font-14" id="showTips" role="tabpanel" aria-labelledby="showTips-tab"> 温馨提示: <br> 1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。<br> 2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。<br> 3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。<br> 4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。 <br> </div> </div> </div> </div> <div class="detail-sidebar d-none d-lg-block"> <div id="columnDetailSiderRight"> <div class="detail-yourlike mt-0 pb-2" id="relativeArticle"> <div class="border-bottom py-2 d-flex align-items-center justify-content-between"> <h5 class="font-16">相关文章</h5> <a class="font-14 hover-letter-spacing" href="/ucenter/search/index.html?text=火车头采集教程火车头采集器使用说明" target="_blank" rel="nofollow">更多<i class="iconfont font-12 pl-1"></i></a> </div> <ul class="font-14 like-list"> <li class=""> <a class="text-ellipsis office-icon text-dark office-icon-doc" href="/p-6161740.html" title="关于火车头采集器的使用方法" target="_blank">关于<span class="text-danger">火</span><span class="text-danger">车</span><span class="text-danger">头</span><span class="text-danger">采</span><span class="text-danger">集</span><span class="text-danger">器</span>的<span class="text-danger">使</span><span class="text-danger">用</span>方法</a> </li> <li class=""> <a class="text-ellipsis office-icon text-dark office-icon-doc" href="/p-6815529.html" title="火车头采集教程火车头采集器使用说明" target="_blank"><span class="text-danger">火</span><span class="text-danger">车</span><span class="text-danger">头</span><span class="text-danger">采</span><span class="text-danger">集</span><span class="text-danger">教</span><span class="text-danger">程</span><span class="text-danger">火</span><span class="text-danger">车</span><span class="text-danger">头</span><span class="text-danger">采</span><span class="text-danger">集</span><span class="text-danger">器</span><span class="text-danger">使</span><span class="text-danger">用</span><span class="text-danger">说</span><span class="text-danger">明</span></a> </li> <li class=""> <a class="text-ellipsis office-icon text-dark office-icon-doc" href="/p-9085884.html" title="火车头采集器不同产品功能比较" target="_blank"><span class="text-danger">火</span><span class="text-danger">车</span><span class="text-danger">头</span><span class="text-danger">采</span><span class="text-danger">集</span><span class="text-danger">器</span>不同产品功能比较</a> </li> <li class=""> <a class="text-ellipsis office-icon text-dark office-icon-doc" href="/p-11554577.html" title="火车头采集器菜鸟使用手册" target="_blank"><span class="text-danger">火</span><span class="text-danger">车</span><span class="text-danger">头</span><span class="text-danger">采</span><span class="text-danger">集</span><span class="text-danger">器</span>菜鸟<span class="text-danger">使</span><span class="text-danger">用</span>手册</a> </li> <li class=""> <a class="text-ellipsis office-icon text-dark office-icon-docx" href="/p-11714145.html" title="火车头采集器-采集与发布带图片的文章" target="_blank"><span class="text-danger">火</span><span class="text-danger">车</span><span class="text-danger">头</span><span class="text-danger">采</span><span class="text-danger">集</span><span class="text-danger">器</span>-<span class="text-danger">采</span><span class="text-danger">集</span>与发布带图片的文章</a> </li> <li class=""> <a class="text-ellipsis office-icon text-dark office-icon-doc" href="/p-16078386.html" title="最新 火车头采集器 locoy采集 发布教程" target="_blank">最新<span class="text-danger">火</span><span class="text-danger">车</span><span class="text-danger">头</span><span class="text-danger">采</span><span class="text-danger">集</span><span class="text-danger">器</span>locoy<span class="text-danger">采</span><span class="text-danger">集</span>发布<span class="text-danger">教</span><span class="text-danger">程</span></a> </li> <li class=""> <a class="text-ellipsis office-icon text-dark office-icon-doc" href="/p-20457619.html" title="火车头采集教程2010sp3采集必备教程" target="_blank"><span class="text-danger">火</span><span class="text-danger">车</span><span class="text-danger">头</span><span class="text-danger">采</span><span class="text-danger">集</span><span class="text-danger">教</span><span class="text-danger">程</span>2010sp3<span class="text-danger">采</span><span class="text-danger">集</span>必备<span class="text-danger">教</span><span class="text-danger">程</span></a> </li> <li class=""> <a class="text-ellipsis office-icon text-dark office-icon-pdf" href="/p-34512330.html" title="火车头采集器ppt演示文稿" target="_blank"><span class="text-danger">火</span><span class="text-danger">车</span><span class="text-danger">头</span><span class="text-danger">采</span><span class="text-danger">集</span><span class="text-danger">器</span>ppt演示文稿</a> </li> <li class=""> <a class="text-ellipsis office-icon text-dark office-icon-doc" href="/p-35939567.html" title="locoy火车头采集教程与实例" target="_blank">locoy<span class="text-danger">火</span><span class="text-danger">车</span><span class="text-danger">头</span><span class="text-danger">采</span><span class="text-danger">集</span><span class="text-danger">教</span><span class="text-danger">程</span>与实例</a> </li> <li class=""> <a class="text-ellipsis office-icon text-dark office-icon-pptx" href="/p-39525470.html" title="火车头采集器初学者入门教程" target="_blank"><span class="text-danger">火</span><span class="text-danger">车</span><span class="text-danger">头</span><span class="text-danger">采</span><span class="text-danger">集</span><span class="text-danger">器</span>初学者入门<span class="text-danger">教</span><span class="text-danger">程</span></a> </li> </ul> </div> <div class="detail-yourlike pb-2"> <div class="border-bottom py-2"> <h5 class="font-16">相关标签</h5> </div> <ul class="font-14 like-list d-flex flex-wrap"> <a class="search-tag" href="/tags/1593641/" target="_blank">火车头</a> <a class="search-tag" href="/tags/1189748/" target="_blank">采集器</a> <a class="search-tag" href="/tags/540196/" target="_blank">教程</a> <a class="search-tag" href="/tags/1520340/" target="_blank">采集</a> <a class="search-tag" href="/tags/543411/" target="_blank">说明</a> <a class="search-tag" href="/tags/540625/" target="_blank">使用</a> </ul> </div> <script src="/d/js/acmsd/thea1.js"></script> </div> </div> </div> <footer> <div class="container d-none d-lg-block mb-4"> <div class="d-flex justify-content-between footer-nav"> <ul class="d-flex foot-nav"> <li> <h5>常见问题</h5> <a class=text-decoration-none href=/help/wenti/upload/ target=_blank> 关于上传 </a><a class=text-decoration-none href=/help/wenti/xiazai/ target=_blank> 关于下载 </a><a class=text-decoration-none href=/help/wenti/qinquan/ target=_blank> 关于侵权 </a><a class=text-decoration-none href=/help/wenti/fenxaing/ target=_blank> 分享文档赚钱教程 </a> </li> <li> <h5>关于我们</h5> <a class=text-decoration-none href=/help/about/wzjs/ target=_blank> 网站介绍 </a><a class=text-decoration-none href=/help/about/gywm/ target=_blank> 关于我们 </a><a class=text-decoration-none href=/help/about/lxwm/ target=_blank> 联系我们 </a> </li> <li> <h5>版权问题</h5> <a class=text-decoration-none href=/help/banquan/bqsm/ target=_blank> 版权声明 </a><a class=text-decoration-none href=/help/banquan/qqcl/ target=_blank> 侵权处理 </a><a class=text-decoration-none href=/help/banquan/mzsm/ target=_blank> 免责声明 </a> </li> <li> <h5>协议条款</h5> <a class=text-decoration-none href=/help/xieyi/yhxy/ target=_blank> 用户协议 </a><a class=text-decoration-none href=/help/xieyi/fwtk/ target=_blank> 用户服务条款 </a><a class=text-decoration-none href=/help/xieyi/ysbh/ target=_blank> 用户隐私保护 </a> </li> <li> <h5>网站导航</h5> <a class="text-decoration-none help-nav-item" href="/sitemaps.xml" data-name="网站地图" target="_blank">网站地图</a> <a class="text-decoration-none help-nav-item" href="/list.html" data-name="全部分类" target="_blank">全部分类</a> <a class="text-decoration-none help-nav-item" href="/sitemaps/index.html" data-name="资源地图" target="_blank">资源地图</a> </li> </ul> <div class="foot-qrcode d-flex"> <div> <div class="subsitute-bg"><img src="https://www.wenku365.com/d/file/2022/07-08/f23df57d987ef7ad9acb33fe5abf9854.jpg"></div> <p>关注公众号<br></p> </div> </div> </div> </div> <div class="footer-copyright"> <p><a href="/" target="_blank">天天文库</a>站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有【成交的100%(原创)】。</p> <p>本站是网络服务平台方,若您的权利被侵害,侵权客服QQ:3074922707 欢迎举报。</p> <p>Copyright 2004-2021 <a href="https://www.wenku365.com/" target="_blank">wenku365.com</a> All Rights Reserved <a href="https://beian.miit.gov.cn/#/Integrated/index" rel="nofollow" target="_blank">闽ICP备15016911号-5 </a></p> <p>闽公网安备 <a href="http://www.beian.gov.cn/portal/registerSystemInfo?recordcode=35052402000320" rel="nofollow" target="_blank">35052402000320</a></p> <p> <a href="https://www.wenku365.com/zt.html" target="_blank">专题文集</a> <a href="https://www.wenku365.com/zt-90007.html" target="_blank">丨职业培训</a> <a href="https://www.wenku365.com/zt-90005.html" target="_blank">丨实用范文</a> <a href="https://www.wenku365.com/zt-90010.html" target="_blank">丨商业材料</a> <a href="https://www.wenku365.com/zt-90013.html" target="_blank">丨合同协议</a> <a href="https://www.wenku365.com/zt-90009.html" target="_blank">丨PPT专题</a></p> </div> </footer> <script src="//static.wenku365.com/wenku365/js/global.min.js?"></script> <script src="//static.wenku365.com/wenku365/js/clipboard.min.js?"></script> <script src="//static.wenku365.com/wenku365/js/jquery.treeview.js?"></script> <script src="//static.wenku365.com/wenku365/js/jquery.share.min.js?"></script> <script src="//static.wenku365.com/wenku365/js/common.min.js?"></script> <script src="//static.wenku365.com/wenku365/js/downloadFile.js?"></script> <script src="//static.wenku365.com/wenku365/js/loginWindow.js?"></script> <script src="//static.wenku365.com/wenku365/js/windowRecharge.js?"></script> <script src="//static.wenku365.com/wenku365/js/viewer.min.js?"></script> <script src="//static.wenku365.com/wenku365/js/detail.js?"></script> <!-- 2023-05-06 17:48:52 --> </body> </html>