后羿采集器,基于人工智能技术,无需编程,可视化操作,免费导出采集结果,只需输入网址就能自动识别采集内容的数据采集工具。 简介 Discuz是由康盛创想科技有限公司(Comsenz)开发的一款知名社区论坛软件,站长可以不需要任何编程基础,通过简单的安装和设置,在互联网上搭建起具备完善功能、很强负载能力和可高度定制的网站。Discuz的基础架构采用世界上最流行的web编程组合PHP+MySQL实现,是一个经过完善设计,适用于各种服务器环境的高效建站解决方案。
问题: 软件未能自动识别到链接怎么办? 回答: 通常情况下后羿采集器会自动识别到网页中的链接,如果未能自动识别到,请参考以下链接识别的教程: 如何采集详情页的链接
问题: 后羿采集器是否可以实时采集?数据源一更新就马上采集? 回答: 后羿采集器没法做到数据源一更新就同步采集更新,但是可以设置定时采集。 了解网站数据的更新频率,相对应地在后羿采集器中对任务设置定时采集。支持按星期/月/时间间隔设置定时,最短可1分钟启动1次。 定时启动的设置请参考以下教程: 如何设置定时采集 【温馨提示】定时启动功能是付费功能,至少需要个人专业版及以上套餐才可使用。
在后羿采集器的智能模式下,如果遇到需要登录才能查看内容的网页,我们可以按照如下图所示的步骤进行预登陆,然后顺利完成数据采集。 具体步骤如下: 第一步:创建智能模式任务(点此查看如何创建任务) 第二步:点击预登录按钮 第三步:输入账号和密码登录网站 第四步:点击“登录完成” 如下图所示: 温馨提示: 用户输入的所有信息均保存在本地,后羿采集器不会上传和存储用户在其他网站的任何个人信息。
流程图模式是后羿采集器团队为了满足用户丰富的个性化数据采集需求而研发的操作模式。 该模式不仅支持可视化的网页点选操作,完全符合人工浏览网页的思维方式,用户只需要打开被采集的网站,用鼠标点击几下就能自动生成复杂的数据采集规则; 同时支持积木式采集组件拼接操作,通过将复杂的采集编码流程进行可视化封装,让开发采集规则就像搭积木一样简单,零基础也能很快上手。 下面给大家演示一下流程图模式的基本操作流程。
如果大家在发布到数据库时遇到一些问题,请参考这个教程进行问题排查:发布到数据库常见问题 作为一款真免费的数据采集软件,我们免费提供多种导出方式,如果小伙伴们需要将采集到的数据发布到数据库MongoDB,可以按照以下操作导出。 步骤一: 数据提取完毕后在导出数据界面选择导出到MongoDB数据库选项。 步骤二: 选择本地数据库,可以创建新配置,也可以使用之前配置好的本地数据库。 创建新配置时,我们需要输入本地数据库地址、端口、用户名、密码、数据库名。 如果地址或者密码什么的输入的不对,会出现not-alive的提示,…