问题: 软件未能自动识别到链接怎么办? 回答: 通常情况下后羿采集器会自动识别到网页中的链接,如果未能自动识别到,请参考以下链接识别的教程: 如何采集详情页的链接
问题: 软件未能自动识别到链接怎么办? 回答: 通常情况下后羿采集器会自动识别到网页中的链接,如果未能自动识别到,请参考以下链接识别的教程: 如何采集详情页的链接
问题: 后羿采集器是否可以实时采集?数据源一更新就马上采集? 回答: 后羿采集器没法做到数据源一更新就同步采集更新,但是可以设置定时采集。 了解网站数据的更新频率,相对应地在后羿采集器中对任务设置定时采集。支持按星期/月/时间间隔设置定时,最短可1分钟启动1次。 定时启动的设置请参考以下教程: 如何设置定时采集 【温馨提示】定时启动功能是付费功能,至少需要个人专业版及以上套餐才可使用。
在后羿采集器的智能模式下,如果遇到需要登录才能查看内容的网页,我们可以按照如下图所示的步骤进行预登陆,然后顺利完成数据采集。 具体步骤如下: 第一步:创建智能模式任务(点此查看如何创建任务) 第二步:点击预登录按钮 第三步:输入账号和密码登录网站 第四步:点击“登录完成” 如下图所示: 温馨提示: 用户输入的所有信息均保存在本地,后羿采集器不会上传和存储用户在其他网站的任何个人信息。
流程图模式是后羿采集器团队为了满足用户丰富的个性化数据采集需求而研发的操作模式。 该模式不仅支持可视化的网页点选操作,完全符合人工浏览网页的思维方式,用户只需要打开被采集的网站,用鼠标点击几下就能自动生成复杂的数据采集规则; 同时支持积木式采集组件拼接操作,通过将复杂的采集编码流程进行可视化封装,让开发采集规则就像搭积木一样简单,零基础也能很快上手。 下面给大家演示一下流程图模式的基本操作流程。
如果大家在发布到数据库时遇到一些问题,请参考这个教程进行问题排查:发布到数据库常见问题 作为一款真免费的数据采集软件,我们免费提供多种导出方式,如果小伙伴们需要将采集到的数据发布到数据库MongoDB,可以按照以下操作导出。 步骤一: 数据提取完毕后在导出数据界面选择导出到MongoDB数据库选项。 步骤二: 选择本地数据库,可以创建新配置,也可以使用之前配置好的本地数据库。 创建新配置时,我们需要输入本地数据库地址、端口、用户名、密码、数据库名。 如果地址或者密码什么的输入的不对,会出现not-alive的提示,…
1、什么样的网页是列表类型的网页 列表类型的网页是具有相同元素的内容页按照一定的线性顺序排列分布的网页,如下图所示: 2、如何采集列表类型的网页 1)软件可以准确识别列表的情况 点击列表中的任一行,软件会自动识别出列表并给出提示,选择“提取列表中的数据”。 软件会自动识别当前页面的分页按钮,我们可以根据提示设置自动翻页操作。 更多详情内容,请参考以下教程: 如何设置分页
什么是防采集? 用大白话来说,就是我们想利用工具采集某个网站的数据(前提当然是公开合法数据),但网站不想给你采集而设置的技术阻挡措施。 网站常见的防采集套路有哪些? 防采套路1:输入验证码框验证 采集难度:★☆☆☆☆ 常见网站:搜狗微信 在采集某些网站过程中,爪子们是不是经常会遇到这样的情况,要求你输入验证码,否则就卡住进行不下去? 对的,这是网站最常用且最基础的防采措施之一,它要求你必须你手动输入验证码里的数字和字母,才能继续看到更多信息或者进行下一步,以此来判断你是机器人还是真人…
八爪鱼采集到的数据,支持导出到SqlServer数据库中。可手动导出,也按照设置的定时导出计划,自动导出。 本教程将以云采集数据,演示手动/自动导出到SqlServer数据库中的具体步骤。 一、手动导出具体步骤 在任务采集完毕之后,将采集得到的数据,手动导出到数据库中。 本地采集和云采集数据,均可手动导出。 Step1:先在您的SqlServer数据库中,建好数据库和数据表。 Step2:在【我的任务】中,选择一个要导出的任务,点击【更多操作】→【查看数据】→【云采集数据】,找到此任务已采集到的云数…