采集场景 孔夫子旧书网有非常多的类目,本教程讲解如何分类目采集图书列表页数据。 示例网址 http://book.kongfz.com/Cjishu/n1004000000/ 是【图书-工程技术-改革开放与80年代】类目的网址。 采集字段 书名、出版社、店铺名称、发货地址、品相、售价等字段。 点击查看高清大图,下文其他图片同理 采集结果 采集结果可导出为Excel、CSV、HTML、数据库等多种格式。导出为Excel示例: 教程说明 本篇制作时间:2022/6/08 八爪鱼版本:…
采集场景 孔夫子旧书网有非常多的类目,本教程讲解如何分类目采集图书列表页数据。 示例网址 http://book.kongfz.com/Cjishu/n1004000000/ 是【图书-工程技术-改革开放与80年代】类目的网址。 采集字段 书名、出版社、店铺名称、发货地址、品相、售价等字段。 点击查看高清大图,下文其他图片同理 采集结果 采集结果可导出为Excel、CSV、HTML、数据库等多种格式。导出为Excel示例: 教程说明 本篇制作时间:2022/6/08 八爪鱼版本:…
采集场景 采集Amazon商品详情页数据。Amazon商品详情页实例网址:https://www.amazon.com/dp/B07R7DY911。 采集字段 title、brand、stars、ratings、questions、price、details、productdimensions、itemweight、shippingweight、asin、itemmodelnumber、bestsellerrank、stock 等。 鼠标放到图片上,右键,选择【在新标签页中打开图片】可查看高清大图 下文其他…
问题: 软件未能自动识别到链接怎么办? 回答: 通常情况下后羿采集器会自动识别到网页中的链接,如果未能自动识别到,请参考以下链接识别的教程: 如何采集详情页的链接
问题: 后羿采集器是否可以实时采集?数据源一更新就马上采集? 回答: 后羿采集器没法做到数据源一更新就同步采集更新,但是可以设置定时采集。 了解网站数据的更新频率,相对应地在后羿采集器中对任务设置定时采集。支持按星期/月/时间间隔设置定时,最短可1分钟启动1次。 定时启动的设置请参考以下教程: 如何设置定时采集 【温馨提示】定时启动功能是付费功能,至少需要个人专业版及以上套餐才可使用。
在后羿采集器的智能模式下,如果遇到需要登录才能查看内容的网页,我们可以按照如下图所示的步骤进行预登陆,然后顺利完成数据采集。 具体步骤如下: 第一步:创建智能模式任务(点此查看如何创建任务) 第二步:点击预登录按钮 第三步:输入账号和密码登录网站 第四步:点击“登录完成” 如下图所示: 温馨提示: 用户输入的所有信息均保存在本地,后羿采集器不会上传和存储用户在其他网站的任何个人信息。