【新手入门】常见问题清单

2023年9月5日 39点热度 0人点赞 0条评论

1、如果您是新手,请务必先看一下官网视频讲解教程。

教程地址:http://www.houyicaiji.com/?type=videolist

视频教程是由我们官方培训讲师给大家讲解后羿采集器的使用方法,每一篇教程其实都很简短,如果大家在开始采集之前先看一下这些视频讲解教程,大部分问题都能得到解答。

 

2、XX 网站能不能采集?XX 数据能不能采集?

请先参考第一条。

官网视频讲解教程中我们已经介绍过,后羿采集器是一款通用网页采集软件,只要是有网址,可以通过网页浏览,您能看得见的内容,大多都是可以采集的(视频比较特殊,得分析具体情况)。

为了保护您的隐私,您所有的任务及配置都以加密形式存储于云端,除了您个人外任何人都无法查看具体的内容,您在采集过程中输入的账号密码以及您的采集结果都存在您的本地电脑中。但请您严格遵守相关的法律法规,若后羿采集器官方收到任何关于非法采集的举报,将会第一时间封停该账号。

 

3、为什么采集数据提前停止了?

如果您遇到采集提前停止的问题,请按照以下步骤自检一下:

第一步:请确认您在浏览器中能看见多少内容

有的时候搜索显示数量和你最终能看得见的数量不是一致的,请确认您能看见多少条数据,然后再确定采集是提前停止还是正常停止。

第二步:采集结果数量和在浏览器中看到的数量不一致

在采集过程中,如果遇到这个问题,有以下两种可能性:

第一种可能性是采集速度过快而网页加载时间过慢,从而导致无法采集到网页中的数据。

遇到这种情况时请增加请求等待时间,等待时间长一点之后,就有足够的时间留给网页加载内容。

请求等待时间的设置在 启动设置—>智能策略中,如下图所示:

第二种可能性是你遇到了其他问题

我们可以通过在运行过程中,点击运行界面中的“查看网页”来观察一下当前的网页内容是否正常,是否无法正常显示,是否出现异常提示等。

如果出现了上述情况,我们可以通过降低采集速度、手动输入验证码等方式,至于哪种方式可以起作用,这个需要您测试后才知道,不同的网站问题不同,没有一个统一的解决方案。

如果尝试了以上方案后仍然无法解决,你可以在帮助中心反馈给我们,我们会为您提供解答。

 

4、为什么采集字段不全?

字段不全一般有以下两种情况:

第一种,由于列表元素的结构不同,有些元素中有的字段其他元素中没有,这是正常的现象,请大家先在网页中确认对应元素中是否存在你想要的字段。

第二种,页面结构发生了变化,这种通常会发生在同一个搜索结果中包含多种页面结构的场景,例如搜索引擎的搜索结果(包含很多种网站)。

这种情况需要针对具体问题进行分析,您可以导出您的采集任务,发到我们官方的帮助中心,我们的客服会帮您进行测试分析。

 

5、为什么采集数据重复?

首先请确认你已经看过视频教程,你的采集任务没有页面类型的设置问题,即错把单页类型设置为列表类型,或是你错误地理解了循环采集的使用方法。

然后请确定你是多次反复采集数据出现重复还是某一次单独采集出现了重复数据。

在未修改采集任务时,每一次运行采集任务都是从头开始采集,所以每一次采集的数据都是重复的,这是正常的。

如果是在单次采集时出现了重复数据,请确认是否满足以下情况:

第一种:重复数据均为最后一页的数据,这种有可能是翻到最后一页未能停止翻页,请尝试修改采集范围,然后看是否还会出现重复数据的情况。

第二种:重复数据为中间页的数据,这种情况无法直接得出结论。

以上两种情况下,都请上传你的采集任务到帮助中心,我们的客服会帮您进行测试分析。

 

6、采集停止了,再运行是不是从头开始?

是的,采集停止之后,下次再直接启动会默认按照上一次的设置从头开始采集。

如果想进行断点续采,请看这个教程:http://www.houyicaiji.com/?type=post&pid=6293

 

7、软件崩溃了,重启后左侧数据都是0,数据丢了吗?

请放心,已经采集到的数据除非你手动删除,否则都不会丢失。

在软件非正常关闭时,重启后左侧任务采集的数据的数量需要手动刷新,你只需点击一下那个数字,就会恢复正常。

 

8、管理员能不能帮我看一下采集任务哪里有问题

后羿采集器为大家提供了QQ客服和帮助中心两种解决采集问题的渠道。

在QQ客服中一般适合提比较简单的具体问题,管理员看见后能够通过简单几句话帮你解决。

如果遇到复杂的采集问题,尤其是需要查看采集任务才能知道的问题,建议大家直接发到帮助中心。

帮助中心的问题会有专人客服跟踪,所有问题都会得到解答,请大家尽量使用帮助中心来反馈问题。

 

9、编辑任务时出现验证码该怎么办?

365crawadmin

这个人很懒,什么都没留下

文章评论

您需要 登录 之后才可以评论