火车头采集器初学者入门教程.ppt

上传人:99****p 文档编号:1454797 上传时间:2019-02-28 格式:PPT 页数:45 大小:1.95MB
下载 相关 举报
火车头采集器初学者入门教程.ppt_第1页
第1页 / 共45页
火车头采集器初学者入门教程.ppt_第2页
第2页 / 共45页
火车头采集器初学者入门教程.ppt_第3页
第3页 / 共45页
火车头采集器初学者入门教程.ppt_第4页
第4页 / 共45页
火车头采集器初学者入门教程.ppt_第5页
第5页 / 共45页
点击查看更多>>
资源描述

1、火车头采集器火车头采集器使用流程说明 使用流程说明主讲人:刘崇秀主讲人:刘崇秀QQ:2415290目录目录n 一、 软件下载n 二、新建站点n 三、采集网址n 四、采集内容n 五 、其他功能火车头采集器官网地址为: http:/最新版本为 8.4,可以从官网下载到,下载地址:http:/ apache、 mysql可以使用一键安装软件 XAMPP :http:/ navicat for mysql版http:/ 软件需要破解注册码: NAVH-WK6A-DMVK-DKW3名称和组织不用填写一、软件下载一、软件下载火车头采集器有付费版和免费版,免费版基本能满足需求。下面内容是以免费版功能进行的讲

2、解。打开火车头软件出现如何界面,由于使用的是免费版本,不用修改,点击登录即可。运行火车头采集器运行火车头采集器打开火车头软件,界面如下图:二、新建站点二、新建站点第一步:根据需要建立分组或任务,任务需要建立在分组之下(如下图)二、新建站点二、新建站点二、新建站点二、新建站点第二步:点击 “ 新建站点 ” 后出现如下界面。 填写任务名称点击起始网址区域右侧 “ 添加 ” 按钮后,根据需求选择添加采集网址模式,这里我们先选择 “ 批量 /多页 ” 为例:三、采集网址三、采集网址三、采集网址三、采集网址以抓取慧聪业界动态 http:/ 、采集、采集 网址网址 -批量批量 /多页多页在地址格式中输入刚才复制的网址,框选中变动的数字,点击右侧的( *)符号会自动输入页码变动符号。由于该网址采用数字等差数列,在 “ 等差数列 ” 右侧首项输入想要采集的起始 ID页数, “ 项数 ” 右侧输入一共要采集的数量,一般为最后页码数。查看下方预览区域中网址是否正确,如正确点击 “ 添加 -完成 ” 按钮。如果添加后发现有错误,可用鼠标点击完成下方的网址,选择删除即可。

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 教育教学资料库 > 课件讲义

Copyright © 2018-2021 Wenke99.com All rights reserved

工信部备案号浙ICP备20026746号-2  

公安局备案号:浙公网安备33038302330469号

本站为C2C交文档易平台,即用户上传的文档直接卖给下载用户,本站只是网络服务中间平台,所有原创文档下载所得归上传人所有,若您发现上传作品侵犯了您的权利,请立刻联系网站客服并提供证据,平台将在3个工作日内予以改正。