问题: 后羿采集器能采什么数据? 回答: 后羿采集器是一款通用的网页数据采集软件,通过内置浏览器访问网页并采集数据,满足以下2个条件的数据均可采集:①网页上公开显示的数据,包含通过账号密码登录后可以查看到的数据。②可以用鼠标复制粘贴下来的数据、网页上没显示但是网页HTML源码中有的数据。 【温馨提示】采集过程中请遵守Robots协议,请勿使用后羿采集器采集任何个人隐私数据,请勿非法使用采集到的数据。为了保护您的隐私,您所有的任务及配置都以加密形式存储于云端,除了您个人外任何人都无法查看具体的内容,您在采集过程中输入…

2023年9月5日 0条评论 39点热度 0人点赞 365crawadmin 阅读全文

如果大家在发布到数据库时遇到一些问题,请参考这个教程进行问题排查:发布到数据库常见问题 作为一款真免费的数据采集软件,我们免费提供多种导出方式,如果小伙伴们需要将采集到的数据发布到数据库MongoDB,可以按照以下操作导出。 步骤一: 数据提取完毕后在导出数据界面选择导出到MongoDB数据库选项。 步骤二: 选择本地数据库,可以创建新配置,也可以使用之前配置好的本地数据库。 创建新配置时,我们需要输入本地数据库地址、端口、用户名、密码、数据库名。 如果地址或者密码什么的输入的不对,会出现not-alive的提示,…

2023年9月5日 0条评论 32点热度 0人点赞 365crawadmin 阅读全文

采集场景 在维基百科网页面 https://zh.wikipedia.org/wiki循环输入多个关键词,采集搜索后展示的多个名词解释的详细数据。       采集字段 岛屿、位置、坐标、群岛、面积 、最高海拔、最高点、人口等字段。   采集结果 采集结果可导出为Excel,CSV,HTML,数据库等多种格式。导出为Excel示例:       教程说明 本篇制作时间:2022/2/28    八爪鱼版本:V8.5.1.21611   采集步骤  步骤一、打开网页 步骤二、批量输入多个关键词并搜索 步骤三、提取检索…

2023年9月5日 0条评论 44点热度 0人点赞 365crawadmin 阅读全文

问题: 后羿采集器能采集XX行业的数据吗? 回答: 可以,我们软件是一款采集网页数据的通用软件。所以首先需明确XX行业的数据存在于哪个网站上。例如,电商行业的数据在电商网站上有,那么采集电商行业的数据,就转化成采集电商网站了。 此时可以参考以下问题: 后羿采集器能采什么数据? 【温馨提示】为了保护您的隐私,您所有的任务及配置都以加密形式存储于云端,除了您个人外任何人都无法查看具体的内容,您在采集过程中输入的账号密码以及您的采集结果都存在您的本地电脑中。但请您严格遵守相关的法律法规,若后羿采集器官方收到任何关于非法采…

2023年9月5日 0条评论 52点热度 0人点赞 365crawadmin 阅读全文

1、连接问题总结 (1)宝塔控制面板 使用此管理工具时需要注意mysql数据库访问权限设置,和远程访问端口的开放。 (2) localhost、192.168.xxx.xxx 使用此类主机地址需要注意是本机需要开启MySQL服务 (3)不确定报错详请 可使用navicat先确定具体报错详情 2、字段映射问题总结 (1)字段类型 仅支持数据表中字符串和整型字段的映射(如果需要映射日期字段,需要将数据表中对应字段改成字符串类型) (2)字段长度 需要注意字段长度是否可以满足本地采集的数据长度 3、导出中的错误日志总结:…

2023年9月5日 0条评论 37点热度 0人点赞 365crawadmin 阅读全文

   请联系客服,将system目录下可用的hostlist.dat替换客户目录下的对应文件

2023年9月4日 0条评论 63点热度 0人点赞 365crawadmin 阅读全文

  对于会更新数据的网站,如果可以通过一个字段判断该网页数据是否更新,则可以编写存储过程来实现,数据库中已有数据的更新,然后新增数据直接插入数据库的功能: 存储过程语句如下: CREATE DEFINER=`root`@`%` PROCEDURE `yhaves`(IN `gaame` VARCHAR(50), IN `plorm` VARCHAR(50), IN `serrea` VARCHAR(200))    LANGUAGE SQL    …

2023年9月4日 0条评论 23点热度 0人点赞 365crawadmin 阅读全文

Web发布中内容发布之前的版本一直是粘贴发布中抓包的数据,然后软件自动分析表单名与表单值,但是对于一些特殊要求的发布网站,这个功能就不大好用,因此,新版本添加了新的自定义发布数据的功能,可以更方便的处理一些复杂的网站。 下面介绍下自定义数据的功能: (1)对于使用json或者其他特殊格式作为post的网站,那么就可以直接使用自定义数据。 (2)对于一些表单项个数不确定的网站。 ①比如发布商品时,有添加发布图片,发布图片有几个那么就需要添加几个表单项,那么就必须要使用自定义数据,发布的图片在采集数据的标签中就定义好,…

2023年9月4日 0条评论 49点热度 0人点赞 365crawadmin 阅读全文

数据提取方式支持调用其他标签值可以让采集过程更加灵活,在提取中点击标签符号即可调用其他标签的值。下面介绍下具体使用方法: 我们以网址:https://detail.tmall.com/item.htm?id=644685533017,为例,目的为提取sku对应的颜色名称,以一个颜色为示例: 目标网站获取数据部分源码: (1)先获取该颜色的sku值 (2)点击标签选择需要调用的标签即可 下面为运行结果: 注意:调用标签在前后截取以及正则提取中皆可使用,使用方法相同。

2023年9月4日 0条评论 54点热度 0人点赞 365crawadmin 阅读全文

火车采集器数据获取新增支持CSS selector,很多网页的css 的属性唯一,此功能更利于批量从网页中提取数据。  如要系统性学习css提取的知识,可以先看下教程:https://www.w3school.com.cn/cssref/css_selectors.asp。 在火车采集器集成了css提取功能,直接将css路径填写在界面中即可使用。Selector中填写css路径,节点属性选择需要采集的属性。 比如: 注意:只有网页源码中有的元素,才能使用css获取,若是源码中没有而是浏览器渲染过后才展示的…

2023年9月4日 0条评论 57点热度 0人点赞 365crawadmin 阅读全文
1678910