JSON采集

八爪鱼提供JSON采集功能，通过打开JSON网址，配置流程，能够进行JSON采集。一、JSON是什么 JSON是一种轻量的数据交换格式，由于一些优秀的特性比如比 XML 更小、更快，更易解析和阅读，并有效地提升网络传输效率，而得到广泛使用。二、JSON采集的优点 1、无需加载图片视频等信息，采集速度更快 2、部分网站防采集限制减少，采集更加顺畅三、JSON采集实例示例网址：https://b2b.baidu.com/ 需求：采集关键词为机械设备的信息地址，包括：公司名/链接/注册/产品/…

2023年9月5日 0条评论 56点热度 0人点赞 365crawadmin 阅读全文

八爪鱼8.4.8版本增加了本地采集升级了加速模式，采集界面有较大优化。本教程将详细介绍8.4.8版本本地采集界面。一、普通模式首先根据自定义入门教程，配置一个采集任务，（这里小八配置了一个当当图书采集的任务，用来给大家演示。）任务配置完成后点击页面右上角的采集，在弹出的启动选项中选择【普通模式】启动采集后就是本地采集的界面，先整体的来看一下下面详细介绍每一个页面的内容 1.默认页面，上半部分显示任务的状态：已采集到的数据、重复数据量、采集用时、平均速度等，下半部分显示的是当前采集到的具体数据。右…

2023年9月5日 0条评论 76点热度 0人点赞 365crawadmin 阅读全文

采集场景点击房天下网站的【二手房】分类，采集【二手房】分类下的房屋数据。采集时可选择目标城市，本示例以深圳二手房为例：https://sz.esf.fang.com 。采集字段房源名称、房屋介绍、联系人、售价、所在小区、具体地址、单位价格等。点击查看高清大图，下文其他图片同理采集结果采集结果可导出为Excel、CSV、HTML、数据库等多种格式。导出为Excel示例：教程说明本篇制作时间：2022/6/29 八爪鱼版本：V8.5.4 如果因网页改版造成网址或步骤无效，无…

2023年9月5日 0条评论 70点热度 0人点赞 365crawadmin 阅读全文

有很多网站，是需要登录账号密码以后，才能采集到目标数据的。有的网站登录时还会需输入验证码。针对这类网站，八爪鱼提供多种解决方法。本课将详细讲解。方法一、浏览器模式+记住Cookie 针对需要登录的网站，我们可以先将八爪鱼切换成浏览器模式，在浏览器模式下完成登录。然后通过获取Cookie记住登录状态。这样，八爪鱼能在执行采集任务时，直接以登录状态打开网页，然后再采集数据。场景一：输入账号、密码登录以豆瓣网为例，登录网址为：https://www.douban.com 实际要采集数据的网址为…

2023年9月5日 0条评论 47点热度 0人点赞 365crawadmin 阅读全文

有时候，我们有大量同类网页，希望八爪鱼能自动采集每个网页中的数据。通过设置【URL循环】，可实现此需求。什么是同类网页？结构相同、字段差不多的网页。例：京东商品详情页： https://item.jd.com/1138288.html https://item.jd.com/27305099378.html https://item.jd.com/46339353993.html 豆瓣电影详情页： https://movie.douban.com/subject/26387939/ https://…

2023年9月5日 0条评论 60点热度 0人点赞 365crawadmin 阅读全文

采集场景打开东方财富网【定向增发股】类目的网页：http://data.eastmoney.com/other/dxzf.html ，采集页面上显示的股票信息。采集字段股票简称、基金代码、发行方式、发行总数、发行价格、最新价、发行日期、增发上市日期、锁定期、股票代码详情链接、当前采集时间等字段。点击查看高清大图，下文其他图片同理采集结果采集结果可导出为Excel、CSV、HTML、数据库等多种格式。导出为Excel示例：采集步骤步骤一、打开网页步骤二、创建【循环-提取…

2023年9月5日 0条评论 31点热度 0人点赞 365crawadmin 阅读全文

在客户端界面介绍里，我们简单讲了数据采集的2种模式：【使用模板采集数据】和【自定义配置采集数据】。本文将详细讲解【使用模板采集数据】，【自定义配置采集数据】可点击开始学习。一、使用【使用模板采集数据】顾名思义，【采集模板】是由八爪鱼官方提供的、做好的采集模板，目前已有200+采集模板，涵盖主流网站的采集场景。模板数还在不断增加。【使用模板采集数据】时，只需输入几个参数（网址、关键词、页数等），就能在几分钟内快速获取到目标网站数据。（类似PPT模板，只需修改关键信息就能直接使用，无需自己从头配置。）…

2023年9月5日 0条评论 46点热度 0人点赞 365crawadmin 阅读全文

为了让更多的用户实现采集需求，满足对网页图片、文档等文件下载等场景的期待，在八爪鱼8.5.2版本上线了【文件下载】功能。大家不仅可以使用八爪鱼采集所需数据，还可以在采集的过程中下载网页上的文件，包括图片、音频、视频、文档等多种格式。采集过程中，当用户需要采集网页中的图片、文档等各类文件时，八爪鱼可智能识别文件类型并提供下载选项，帮助用户一次性获取所需数据及文件。【文件下载】功能支持图片、音频、视频、文档等多种格式的文件下载，例如：但需要注意目前八爪鱼【文件下载】功能仅支持本地采集模式，云采集文件…

2023年9月5日 0条评论 62点热度 0人点赞 365crawadmin 阅读全文

八爪鱼采集到的数据，支持导出到Mysql数据库中。可手动导出，也按照设置的定时导出计划，自动导出。本教程将以云采集数据，演示手动/自动导出到Mysql数据库中的具体步骤。一、手动导出具体步骤在任务采集完毕之后，将采集得到的数据，手动导出到数据库中。本地采集和云采集数据，均可手动导出。 Step1：先在您的Mysql中，建好数据库和数据表。 Step2：在【我的任务】中，将鼠标移动到任务上，任务采集状态右侧会出现全部按钮，点击即可进入查看采集到的数据，这里点击云采集右侧的全部，查看全部云采集数…

2023年9月5日 0条评论 60点热度 0人点赞 365crawadmin 阅读全文

在学习本教程之前，您需要具备八爪鱼基础操作和XPath相关知识，如果还未掌握，请先学习以下课程。自定义模式入门：https://www.bazhuayu.com/tutorial8/xsrm/81zdyrm XPath 系统学习与实例：https://www.bazhuayu.com/tutorial8/81xpath 一、相对XPath 相对Xpath，即相对于循环框的Xpath，有两个典型特征：跟随循环联动；与循环框的XPath合并成一条完整的定位XPath。有两种常见应用场景：提取循环内的数据；提取循…

2023年9月5日 0条评论 70点热度 0人点赞 365crawadmin 阅读全文

1…3 456 7…13

JSON采集

本地采集界面介绍

【房天下】二手房数据采集

登录后再采集数据

URL循环：批量采集同类网页

【东方财富】定向增发股数据采集

使用模板采集数据

文件边采集边下载

导出到Mysql数据库

相对XPath学习与实例

近期文章

近期评论