用户在创建任务的时候,首先要输入正确的网址,采集器上的输入框和一般的浏览器搜索框不同,需要输入网址而不能直接输入文字。 用户在输入网址的时候,不要直接输入首页的网址,要输入搜索结果页的网址。 例如: 如果用户要采集后羿采集器上文档教程的内容,如果直接输入后羿采集器首页的网址,那我们是采集不到文档教程的内容的。 我们需要复制的是展示了采集对象的页面的网址,才能采集到具体内容,如下图所示的网址。   【温馨提示】以上建议仅针对第一次使用的新手用户,并不代表后羿采集器的智能模式无法从首页开始采集,如果从首页开始…

2023年9月5日 0条评论 56点热度 0人点赞 365crawadmin 阅读全文

一、文件下载功能简介 后羿采集器支持在采集的过程中下载文件,文件类型包括:图片、音频、视频、文档、其他文件,启用文件下载功能的位置如下图所示: 需要注意的是,此处的设置只是针对文件下载功能的开启,所有的文件下载都需要在采集字段中设置对应的下载链接或者下载按钮。 在下载文件时,软件支持对文件下载路径进行修改,你可以按照下图进行设置: 在下载文件时,软件支持按照一定的规则创建独立的文件夹用来存放文件,规则包括按照文件类型、采集日期、任务名称或者按照字段值给文件夹命名,如下图所示: 在下载文件时,软件支持按照一定的规则重…

2023年9月5日 0条评论 35点热度 0人点赞 365crawadmin 阅读全文

在采集的过程中,我们可能会遇到异常停止的情况,如果我们希望再一次启动任务时从上一次停止的位置开始采集,我们需要使用断点续采的功能。 由于各种因素,自动断点续采这个功能现在暂时还无法实现,目前断点续采有两种方案: 1、通过去重功能来进行断点续采 直接在启动任务时进行数据去重设置,选择“当所有字段都重复时,跳过继续采集”。 该方案设置简单,但是效率较低,设置之后任务仍然会从第一页开始采集,然后逐个跳过所有已经采集到的数据。 2、通过修改采集范围、修改网址或添加预操作来进行断点续采 当任务停止时,软件的停止界面上会记录当…

2023年9月5日 0条评论 49点热度 0人点赞 365crawadmin 阅读全文

如果需要设置采集范围,可以点击页面上的采集范围按钮直接设置采集范围。 1、设置起始页和结束页 起始页默认为当前页,结束页默认为最后一页。需要注意的是如果选择自定义设置,当前页为第一页。 2、设置跳过项 在采集中可以跳过每页前多少条或者后多少条。 3、设置停止采集 正常的采集任务会根据上述范围从开始页采集到结束页,此处的停止采集是在采集过程中满足设置条件时提前停止采集。停止采集条件设置和数据筛选条件的设置相同,请参考如何设置数据筛选。

2023年9月5日 0条评论 45点热度 0人点赞 365crawadmin 阅读全文

在采集数据时如果遇到没采集到全部数据就停止采集的情况,可以点击“查看网页”按钮,确认一下采集过程中页面打开是否异常。本文主要讲解如何将采集时的当前页保存成文件。 步骤一:点击“查看网页”按钮 启动任务之后软件会自动打开“任务运行界面”,在这个界面上我们点击“查看网页”按钮即可看到当前正在采集的页面。 可以通过查看网页界面确认任务当前页的打开情况,包括设置的预执行操作是否有正常运行,是否有正常翻页,是否有广告弹窗,是否遇到验证码等。 步骤二:点击下载当前网页 在打开的当前页右上角,有一个“保存当前网页到文件系统”按钮…

2023年9月5日 0条评论 58点热度 0人点赞 365crawadmin 阅读全文

后羿采集器,基于人工智能技术,无需编程,可视化操作,免费导出采集结果,只需输入网址就能自动识别采集内容的数据采集工具。 简介 Excel是一种常用的电子表格软件,由微软公司开发和发布。它提供了一套强大的数据处理和分析工具,广泛应用于各个领域和行业。

2023年9月5日 0条评论 52点热度 0人点赞 365crawadmin 阅读全文

后羿采集器,基于人工智能技术,无需编程,可视化操作,免费导出采集结果,只需输入网址就能自动识别采集内容的数据采集工具。 简介 Sitecore是一家提供数字体验管理解决方案的公司。其主打产品Sitecore Experience Platform是一个综合的数字体验平台,帮助企业构建和管理个性化、多渠道的数字体验,包括网站、移动应用、社交媒体等。Sitecore的产品提供了内容管理、数据分析、个性化营销等功能,可以帮助企业实现更好的客户体验和营销效果。

2023年9月5日 0条评论 99点热度 0人点赞 365crawadmin 阅读全文

后羿采集器,基于人工智能技术,无需编程,可视化操作,免费导出采集结果,只需输入网址就能自动识别采集内容的数据采集工具。 简介 BigCommerce是一种全球领先的电子商务平台,专注于为企业和个人创业者提供强大的在线商店建设和管理工具。它为用户提供了丰富的功能和灵活的定制选项,帮助他们轻松创建、设计和运营自己的电子商务网站。

2023年9月5日 0条评论 90点热度 0人点赞 365crawadmin 阅读全文

问题: 采集停止了,再运行是不是从头开始? 回答: 是的,采集停止之后,下次再启动任务会默认按照上一次的设置从头开始采集。如果想进行断点续采,请参考以下教程: 如何实现断点续采

2023年9月5日 0条评论 48点热度 0人点赞 365crawadmin 阅读全文

问题: 后羿采集器能采集国外网站的数据吗? 回答: 后羿采集器的原理和复制粘贴类似,理论上来说只要是网页上或者是源代码里有的数据都能够采集。 只要您的目标网站能够在软件里打开,理论上就是能够采集的。 【温馨提示】软件本身没有翻墙功能,如果海外网站是需要翻墙才能访问的,还请自行翻墙。后羿采集器官方无法提供任何关于如何翻墙的帮助,还请理解,实在抱歉。

2023年9月5日 0条评论 82点热度 0人点赞 365crawadmin 阅读全文
1121314151629