智能模式是后羿采集器中最简单的模式,也是我们首推的模式,尤其适合新手用户,本教程主要给大家介绍如何创建智能模式任务。 1、创建智能模式任务的位置: 1)在采集器首页输入框:只能输入一个网址。 在此输入网址之后,软件会直接跳转到任务编辑界面,用户可在任务编辑界面继续操作。 2)在左侧工具栏新建智能模式任务 3)在首页输入框下的右侧开始采集按钮新建智能模式任务 从 2)和 3)的位置点击之后会进入智能模式任务创建的界面,用户可以在此进行更多的设置。 2、创建智能模式任务的设置 1)选择任务创建的分组 用户可以在这里选择…

2023年9月5日 0条评论 71点热度 0人点赞 365crawadmin 阅读全文

流程图任务是由各种组件构成的,每种组件对应不同的操作,下面我们针对每个组件及其对应的设置参数进行详细的介绍。 1、打开网页 打开网页组件的作用是打开网页,流程图任务创建时会自动生成一个打开网页组件,该组件作为任务的第一个组件,不能被拖动或者删除。 在右侧的组件设置窗口中,点击右侧任务网址可以进行编辑,此处的编辑和编辑流程图任务网址是相同的操作。 当打开网页组件不处于任务起始位置时,设置如下图所示,选择自定义选项可以输入自定义的网址。 2、点击 点击组件的作用是点击页面中的元素,它的设置如下图所示: 通常该组件会在点…

2023年9月5日 0条评论 52点热度 0人点赞 365crawadmin 阅读全文

如果大家在发布到数据库时遇到一些问题,请参考这个教程进行问题排查:发布到数据库常见问题 作为一款真免费的数据采集软件,我们免费提供多种导出方式,如果小伙伴们需要将采集到的数据发布到数据库MySQL,可以按照以下操作导出。 步骤一: 数据提取完毕后在导出数据界面选择导出到MySQL数据库选项。 步骤二: 选择本地数据库,可以创建新配置,也可以使用之前配置好的本地数据库。 创建新配置时,我们需要输入本地数据库地址、端口、用户名、密码。 如果地址或者密码什么的输入的不对,会出现Error的提示,此时需要检查是否正确输入地…

2023年9月5日 0条评论 47点热度 0人点赞 365crawadmin 阅读全文

数据去重功能是指在任务采集过程中,将当前采集到的数据和该任务中已保存的所有数据进行对比,如果数据重复,则按照设置条件进行处理。 在编辑任务界面,点击右下角“开始采集”按钮,在弹出的设置框中,点击“数据去重”选项可以切换到数据去重设置界面。 1、去重条件 1)所有字段都重复 勾选“所有字段都重复”这个去重条件,意味着两行数据必须完全相同,软件才会执行去重。只要两行数据中有任意一个字段不相同,该数据都不会被判定为重复数据。 需要注意的是,很多网页内容中存在时间或阅读数这一类会变化的内容,包含此类内容时,数据往往看上去大…

2023年9月5日 0条评论 43点热度 0人点赞 365crawadmin 阅读全文

在数据采集的时候,经常会需要倒序采集(从最后一页开始往前采集数据)的情况。本文将简单说明如何使用后羿采集器的智能模式进行网页数据的倒序采集。 情况一:列表页翻页后,链接改变,存在最后一页链接 处理方式一:将列表页最后一页链接作为采集链接 当我们能够直接拿到网站列表页最后一页的链接时,可以通过直接复制链接的形式,用最后一页的链接来创建采集任务。 1. 在浏览器里点击到最后一页,复制最后一页的链接。

2023年9月5日 0条评论 69点热度 0人点赞 365crawadmin 阅读全文

后羿采集器,基于人工智能技术,无需编程,可视化操作,免费导出采集结果,只需输入网址就能自动识别采集内容的数据采集工具。 简介 WordPress是一种流行的开源内容管理系统(CMS),用于创建和管理网站。它是一个功能强大、灵活且易于使用的平台,被广泛应用于个人博客、商业网站、新闻门户、电子商务平台等各种类型的网站。

2023年9月5日 0条评论 164点热度 0人点赞 365crawadmin 阅读全文

后羿采集器,基于人工智能技术,无需编程,可视化操作,免费导出采集结果,只需输入网址就能自动识别采集内容的数据采集工具。 简介 TXT格式是一种纯文本格式,全称为”Text File”,即文本文件。它是一种非常简单的文件格式,仅包含纯文本内容,没有任何格式化、样式、图像或其他多媒体元素。

2023年9月5日 0条评论 52点热度 0人点赞 365crawadmin 阅读全文

后羿采集器,基于人工智能技术,无需编程,可视化操作,免费导出采集结果,只需输入网址就能自动识别采集内容的数据采集工具。 简介 Umbraco是一个基于ASP.NET的免费开源内容管理系统(CMS)。它提供了灵活的内容管理功能,允许用户轻松地创建和管理网站内容。Umbraco还支持自定义模板和插件,使用户可以根据自己的需求定制网站功能。其开源性质意味着开发者可以自由地修改和扩展系统,以满足特定的业务需求。

2023年9月5日 0条评论 51点热度 0人点赞 365crawadmin 阅读全文

后羿采集器,基于人工智能技术,无需编程,可视化操作,免费导出采集结果,只需输入网址就能自动识别采集内容的数据采集工具。 简介 Weebly是一个用户友好的网站建设平台,旨在帮助个人用户、创业者和小型企业轻松创建和管理自己的网站和在线商店。无需编程知识,用户可以通过拖放式界面选择模板、添加内容、调整布局和设计,快速搭建出具有专业外观的网站。

2023年9月5日 0条评论 51点热度 0人点赞 365crawadmin 阅读全文

问题: 采集文章会保存格式吗? 回答: 不会。 软件的采集是不支持格式的保存的。如果需要保存格式,请右键设置取值属性,选择提取外部HTML选项,然后在导出的时候选择导出成HTML文件。

2023年9月5日 0条评论 60点热度 0人点赞 365crawadmin 阅读全文
1121314151629