通过前几课的学习,我们已经学会了 采集列表数据、采集表格数据。如果一个页面上很多同类链接,需要依次点击每个链接进入详情页,然后采集每个详情页中的数据呢? 以百度百家号为例。现在有一个百家号资讯列表的网页:https://www.baidu.com/s?tn=news&rtt=1&bsst=1&cl=2&wd=%E6%95%B0%E6%8D%AE%E9%87%87%E9%9B%86&medium=2 可以看到,网页上有很多资讯链接,点击每个资讯链接进入详情页,每个详情页都有…
通过前几课的学习,我们已经学会了 采集列表数据、采集表格数据。如果一个页面上很多同类链接,需要依次点击每个链接进入详情页,然后采集每个详情页中的数据呢? 以百度百家号为例。现在有一个百家号资讯列表的网页:https://www.baidu.com/s?tn=news&rtt=1&bsst=1&cl=2&wd=%E6%95%B0%E6%8D%AE%E9%87%87%E9%9B%86&medium=2 可以看到,网页上有很多资讯链接,点击每个资讯链接进入详情页,每个详情页都有…
通过前几课的学习,我们已经学会了采集一页数据:列表、表格、点击链接进入详情的数据。 在实际使用过程中,经常是需要翻页来采集更多的数据。对于需要翻页的网站,我们该如何操作呢? 本课将讲解常见的网页翻页类型,以及用八爪鱼实现翻页的方法。 一、点击 【下一页】按钮翻页 点击页面上的 【下一页】按钮翻页,是最常见的翻页方式。这个网站就是如此:http://www.ggzy.gov.cn/information/info/news/news.shtml 鼠标放到图片上,右键,选择【在新标签页中打开图片…
经过前几课的学习,我们已经掌握了列表数据、表格数据、点击多个链接后的详情页数据、实现翻页 的任务配置方法。 任务配置完成后,即可启动采集任务,全自动的采集数据。配置好的任务可【启动本地采集】运行在本地电脑中,也可【启动云采集】运行在由八爪鱼提供的云服务器上。本地采集和云采集完成后得到的数据,可以Ecxel、CSV、HTML、数据库(SqlServer、MySql)、API等多种形式导出。 一、【启动本地采集】和【启动云采集】 1、【启动本地采集】 【启动本地采集】即用自己的本地电脑进行数据采集…
经过前几课的学习,我们已经掌握了列表数据、表格数据、点击多个链接后的详情页数据、实现翻页 的任务配置方法。 在此基础上,本课将详解八爪鱼的采集原理和流程执行逻辑,让大家对八爪鱼采集数据的方法有一个更深入的理解。 一、八爪鱼采集原理 1、模拟人的行为,通过内置Chrome浏览器浏览网页数据。 所以采集数据的第一步永远是找到目标网址并输入。这跟通过普通浏览器访问网页完全一样。 在普通浏览器中需要点击链接进入详情、点击翻页按钮查看更多数据,在八爪鱼中也需如此操作。 2、根据网页特性和采集需求,设计采…
采集场景 在百度首页 https://www.baidu.com/ 输入关键词搜索,采集搜索后得到的搜索结果。 采集字段 标题、网页链接、简介 采集结果 采集结果可导出为Excel,CSV,HTML,数据库等多种格式。导出为Excel示例: 教程说明 本篇更新时间:2022/6/9 八爪鱼版本:V8.5.2 如果因网页改版造成网址或步骤无效,无法采集到目标数据,请联系官方客服,我们将及时修正。 采集步骤 步骤一、打开网页 步骤二、批量输入多个关键词并搜索 步骤三、创建【循环翻页】,采…
有很多网站,需要输入关键词查询,然后采集查询后得到的结果数据。 例如:在京东首页搜索框中输入商品名称搜索,采集搜索后得到的商品信息;在新闻网站的搜索框中,输入热门关键词,采集搜索后得到的最新资讯。 在八爪鱼中该如何操作呢?来看一下具体的操作步骤。 一、输入1个关键词查询 示例网址:https://www.jd.com 采集需求:在京东首页,输入关键词【手机】,采集出现的手机商品数据。 Step1. 输入网址打开网页。选中网页中的文本输入框,在提示框中选择【输入文字】,输入关键词【手机】,按【确定…
有时候,我们有大量同类网页,希望八爪鱼能自动采集每个网页中的数据。通过设置【URL循环】,可实现此需求。 什么是同类网页?结构相同、字段差不多的网页。例: 京东商品详情页: https://item.jd.com/1138288.html https://item.jd.com/27305099378.html https://item.jd.com/46339353993.html 豆瓣电影详情页: https://movie.douban.com/subject/26387939/ https://…
采集场景 在百度图片首页(http://image.baidu.com/)输入关键词搜索,采集得到的图片地址。示例是搜索关键词【三清山】得到的图片。 采集字段 搜索关键词、图片地址、图片保存文件路径。 鼠标放到图片上,右键,选择【在新标签页中打开图片】可查看高清大图 下文其他图片同理 采集结果 采集结果可导出为Excel,CSV,HTML,数据库等多种格式。导出为Excel示例: 教程说明 本篇制作时间:2022/6/30 八爪鱼版本:V8.5.4 如果因网页改版造成网址或步骤无效,无法采…