1、火车头采集器火车头采集器使用流程说明 使用流程说明主讲人:刘崇秀主讲人:刘崇秀QQ:2415290目录目录n 一、 软件下载n 二、新建站点n 三、采集网址n 四、采集内容n 五 、其他功能火车头采集器官网地址为: http:/最新版本为 8.4,可以从官网下载到,下载地址:http:/ apache、 mysql可以使用一键安装软件 XAMPP :http:/ navicat for mysql版http:/ 软件需要破解注册码: NAVH-WK6A-DMVK-DKW3名称和组织不用填写一、软件下载一、软件下载火车头采集器有付费版和免费版,免费版基本能满足需求。下面内容是以免费版功能进行的讲
2、解。打开火车头软件出现如何界面,由于使用的是免费版本,不用修改,点击登录即可。运行火车头采集器运行火车头采集器打开火车头软件,界面如下图:二、新建站点二、新建站点第一步:根据需要建立分组或任务,任务需要建立在分组之下(如下图)二、新建站点二、新建站点二、新建站点二、新建站点第二步:点击 “ 新建站点 ” 后出现如下界面。 填写任务名称点击起始网址区域右侧 “ 添加 ” 按钮后,根据需求选择添加采集网址模式,这里我们先选择 “ 批量 /多页 ” 为例:三、采集网址三、采集网址三、采集网址三、采集网址以抓取慧聪业界动态 http:/ 、采集、采集 网址网址 -批量批量 /多页多页在地址格式中输入刚才复制的网址,框选中变动的数字,点击右侧的( *)符号会自动输入页码变动符号。由于该网址采用数字等差数列,在 “ 等差数列 ” 右侧首项输入想要采集的起始 ID页数, “ 项数 ” 右侧输入一共要采集的数量,一般为最后页码数。查看下方预览区域中网址是否正确,如正确点击 “ 添加 -完成 ” 按钮。如果添加后发现有错误,可用鼠标点击完成下方的网址,选择删除即可。