后羿采集器,基于人工智能技术,无需编程,可视化操作,免费导出采集结果,只需输入网址就能自动识别采集内容的数据采集工具。 简介 CrownPeak是一家数字体验管理平台提供商,专注于帮助企业优化其数字内容和在线体验。该平台旨在提供强大的工具,以便企业能够更轻松地创建、管理和优化其网站、移动应用和数字内容。CrownPeak的目标是帮助企业在数字化时代中实现更高的客户参与度、品牌价值和业务增长。
问题: 如何既采集列表,又采集详情中的数据 / 如何采集详情页? 回答: 后羿采集器有深入采集的功能,只需要点击“深入采集”按钮,或者点击已经采集到的链接就能进入详情页进行采集。 具体操作请参考教程: 如何设置深入采集
在后羿采集器中,采集任务的基础设置如下: 1、创建新任务 后羿采集器提供了任务的多种创建方式,可以直接在主页上点击相应的按钮新建不同模式的采集任务,也可以点击左上角图标,创建新任务。 2、删除任务 在删除单个任务时可直接点击任务右侧的“×”进行删除,如果要删除多个任务,可以按Ctrl或Shift键选中多个任务后,右击进行删除。 3、任务设置 右击任务,在弹出的菜单中对其进行设置。具体设置包括:启动任务、编辑任务、查看数据、修改名称、导出规则、修改分组和删除任务。 4、创建任务分组 点击左上角图标,创建任务分组,同时…
在后羿采集器的智能模式下,我们通过以下几种方式来导出采集结果。 1、导出前台运行任务的采集结果 如果采集任务在前台运行,在任务结束后软件会弹出数据采集停止的提示框,此时我们点击“导出数据”按钮,即可导出采集数据结果。 2、导出后台运行任务的采集结果 如果采集任务在后台运行,在任务结束后,桌面右下角会弹出导出提示框,我们根据右下角任务完成的弹框提示打开查看数据界面,或者导出数据。 3、导出已经保存过的采集任务的采集结果 如果不是实时运行的采集任务,而是之前运行过的采集任务,例如我们关闭软件之后又重新打开软件,然导出一…
后羿采集器支持批量生成网址功能,即通过设置一定的规则,自动生成您需要的网址,智能模式和流程图模式的具体设置位置相同,在新建采集任务界面中,如下图所示: 批量生成网址一般用于多网址采集的场景,这里又可以分为两种情况: 第一种:当网页中没有翻页按钮时,这种情况下无法通过点击翻页按钮进行循环翻页采集,这种网站各个分页的网址一般都只有部分参数(例如页面编号)不同,因此可以通过使用批量生成网址功能来一次性生成所有的分页网址,然后按照多网址进行采集。 第二种:当你需要采集多个网址,但是这些网址是符合一定的规则的,那么就可以通过…
在智能模式中,后羿采集器会自动识别分页,分页类型通常包括以下几种: (1)分页按钮 (2)滚动加载 (3)瀑布流分页(滚动加载)+ 分页按钮 (4)不启用分页 但是偶尔也会发生识别结果错误的情况,原因通常包括以下几种: (1)网页加载速度过慢,软件自动识别结束之后才出现分页按钮 (2)页面中存在多个分页按钮,软件最终只会选择其中的一个 (3)在滚动加载和分页按钮同时存在的情况中,软件自动滚动多次之后分页按钮仍未出现。 (4)当前页面中的分页按钮软件暂时未兼容 “分页设置”的设置菜单如下图所示。 针对不同的分页类型,…
后羿采集器目前已经支持“邮件提醒”功能,开启邮件提醒功能后,当用户的采集任务在运行过程中遇到需要“输入验证码”或“登录网站”情况时,后羿采集器会通过邮件提醒的方式通知用户。 注意:后羿采集器“邮件提醒”功能仅限企业标准版及以上套餐使用。 下面介绍下使用后羿采集器“邮件提醒”功能的具体操作步骤: 1.配置邮件推送服务 “邮件提醒”功能使用的前提是:配置好邮件推送服务参数。意思是,用户需要使用一个邮箱来作为推送提醒邮件的中转站,所有的提醒邮件都会通过这个邮箱来进行推送的,下面以163邮箱为例进行说明。 首先,在163邮…
八爪鱼提供两套API接口,均可以获取通过八爪鱼采集到的数据,实现秒级导出; 获取任务信息,无需启动八爪鱼客户端即可控制任务启停;无缝对接企业的内部系统。 第一套接口今后将不再更新,为提升您今后的使用体验,推荐您使用第二套API接口。 第一套API接口 : 于2018年4月上线,分为 数据导出API 主域名:https://dataapi.bazhuayu.com/ 和 任务控制API 主域名:https://advancedapi.bazhuayu.com/ 第二套API接口 : 于2021年1…