后羿采集器,基于人工智能技术,无需编程,可视化操作,免费导出采集结果,只需输入网址就能自动识别采集内容的数据采集工具。 简介 Liferay是一款开源的企业级门户软件,它是一个功能丰富的数字化解决方案,用于构建Web门户、内容管理系统、社区平台、电子商务和协作工具。Liferay提供了一套强大的工具和功能,使企业能够创建个性化、安全可靠的数字化平台,与员工、客户和合作伙伴进行交互和沟通。其开源的特性使得Liferay成为企业广泛应用的选择,同时提供了大量的插件和扩展,使得它非常灵活和可定制。
问题: 软件未能自动识别到链接怎么办? 回答: 通常情况下后羿采集器会自动识别到网页中的链接,如果未能自动识别到,请参考以下链接识别的教程: 如何采集详情页的链接
问题: 后羿采集器是否可以实时采集?数据源一更新就马上采集? 回答: 后羿采集器没法做到数据源一更新就同步采集更新,但是可以设置定时采集。 了解网站数据的更新频率,相对应地在后羿采集器中对任务设置定时采集。支持按星期/月/时间间隔设置定时,最短可1分钟启动1次。 定时启动的设置请参考以下教程: 如何设置定时采集 【温馨提示】定时启动功能是付费功能,至少需要个人专业版及以上套餐才可使用。
在后羿采集器的智能模式下,如果遇到需要登录才能查看内容的网页,我们可以按照如下图所示的步骤进行预登陆,然后顺利完成数据采集。 具体步骤如下: 第一步:创建智能模式任务(点此查看如何创建任务) 第二步:点击预登录按钮 第三步:输入账号和密码登录网站 第四步:点击“登录完成” 如下图所示: 温馨提示: 用户输入的所有信息均保存在本地,后羿采集器不会上传和存储用户在其他网站的任何个人信息。
流程图模式是后羿采集器团队为了满足用户丰富的个性化数据采集需求而研发的操作模式。 该模式不仅支持可视化的网页点选操作,完全符合人工浏览网页的思维方式,用户只需要打开被采集的网站,用鼠标点击几下就能自动生成复杂的数据采集规则; 同时支持积木式采集组件拼接操作,通过将复杂的采集编码流程进行可视化封装,让开发采集规则就像搭积木一样简单,零基础也能很快上手。 下面给大家演示一下流程图模式的基本操作流程。
如果大家在发布到数据库时遇到一些问题,请参考这个教程进行问题排查:发布到数据库常见问题 作为一款真免费的数据采集软件,我们免费提供多种导出方式,如果小伙伴们需要将采集到的数据发布到数据库MongoDB,可以按照以下操作导出。 步骤一: 数据提取完毕后在导出数据界面选择导出到MongoDB数据库选项。 步骤二: 选择本地数据库,可以创建新配置,也可以使用之前配置好的本地数据库。 创建新配置时,我们需要输入本地数据库地址、端口、用户名、密码、数据库名。 如果地址或者密码什么的输入的不对,会出现not-alive的提示,…
1、什么样的网页是列表类型的网页 列表类型的网页是具有相同元素的内容页按照一定的线性顺序排列分布的网页,如下图所示: 2、如何采集列表类型的网页 1)软件可以准确识别列表的情况 点击列表中的任一行,软件会自动识别出列表并给出提示,选择“提取列表中的数据”。 软件会自动识别当前页面的分页按钮,我们可以根据提示设置自动翻页操作。 更多详情内容,请参考以下教程: 如何设置分页