通过前几课的学习,我们已经学会了 采集列表数据、采集表格数据。如果一个页面上很多同类链接,需要依次点击每个链接进入详情页,然后采集每个详情页中的数据呢?   以百度百家号为例。现在有一个百家号资讯列表的网页:https://www.baidu.com/s?tn=news&rtt=1&bsst=1&cl=2&wd=%E6%95%B0%E6%8D%AE%E9%87%87%E9%9B%86&medium=2 可以看到,网页上有很多资讯链接,点击每个资讯链接进入详情页,每个详情页都有…

2023年9月5日 0条评论 40点热度 0人点赞 365crawadmin 阅读全文

通过前几课的学习,我们已经学会了采集一页数据:列表、表格、点击链接进入详情的数据。   在实际使用过程中,经常是需要翻页来采集更多的数据。对于需要翻页的网站,我们该如何操作呢?   本课将讲解常见的网页翻页类型,以及用八爪鱼实现翻页的方法。   一、点击 【下一页】按钮翻页   点击页面上的 【下一页】按钮翻页,是最常见的翻页方式。这个网站就是如此:http://www.ggzy.gov.cn/information/info/news/news.shtml     鼠标放到图片上,右键,选择【在新标签页中打开图片…

2023年9月5日 0条评论 37点热度 0人点赞 365crawadmin 阅读全文

云采集日志主要有两个方面的应用:

2023年9月5日 0条评论 33点热度 0人点赞 365crawadmin 阅读全文

 经过前几课的学习,我们已经掌握了列表数据、表格数据、点击多个链接后的详情页数据、实现翻页 的任务配置方法。   任务配置完成后,即可启动采集任务,全自动的采集数据。配置好的任务可【启动本地采集】运行在本地电脑中,也可【启动云采集】运行在由八爪鱼提供的云服务器上。本地采集和云采集完成后得到的数据,可以Ecxel、CSV、HTML、数据库(SqlServer、MySql)、API等多种形式导出。     一、【启动本地采集】和【启动云采集】   1、【启动本地采集】   【启动本地采集】即用自己的本地电脑进行数据采集…

2023年9月5日 0条评论 27点热度 0人点赞 365crawadmin 阅读全文

 经过前几课的学习,我们已经掌握了列表数据、表格数据、点击多个链接后的详情页数据、实现翻页 的任务配置方法。   在此基础上,本课将详解八爪鱼的采集原理和流程执行逻辑,让大家对八爪鱼采集数据的方法有一个更深入的理解。   一、八爪鱼采集原理   1、模拟人的行为,通过内置Chrome浏览器浏览网页数据。   所以采集数据的第一步永远是找到目标网址并输入。这跟通过普通浏览器访问网页完全一样。 在普通浏览器中需要点击链接进入详情、点击翻页按钮查看更多数据,在八爪鱼中也需如此操作。   2、根据网页特性和采集需求,设计采…

2023年9月5日 0条评论 35点热度 0人点赞 365crawadmin 阅读全文

采集场景 在百度首页 https://www.baidu.com/  输入关键词搜索,采集搜索后得到的搜索结果。     采集字段 标题、网页链接、简介   采集结果 采集结果可导出为Excel,CSV,HTML,数据库等多种格式。导出为Excel示例:     教程说明 本篇更新时间:2022/6/9    八爪鱼版本:V8.5.2 如果因网页改版造成网址或步骤无效,无法采集到目标数据,请联系官方客服,我们将及时修正。   采集步骤 步骤一、打开网页 步骤二、批量输入多个关键词并搜索 步骤三、创建【循环翻页】,采…

2023年9月5日 0条评论 37点热度 0人点赞 365crawadmin 阅读全文

有很多网站,需要输入关键词查询,然后采集查询后得到的结果数据。   例如:在京东首页搜索框中输入商品名称搜索,采集搜索后得到的商品信息;在新闻网站的搜索框中,输入热门关键词,采集搜索后得到的最新资讯。   在八爪鱼中该如何操作呢?来看一下具体的操作步骤。   一、输入1个关键词查询   示例网址:https://www.jd.com 采集需求:在京东首页,输入关键词【手机】,采集出现的手机商品数据。   Step1. 输入网址打开网页。选中网页中的文本输入框,在提示框中选择【输入文字】,输入关键词【手机】,按【确定…

2023年9月5日 0条评论 17点热度 0人点赞 365crawadmin 阅读全文

有时候,我们有大量同类网页,希望八爪鱼能自动采集每个网页中的数据。通过设置【URL循环】,可实现此需求。   什么是同类网页?结构相同、字段差不多的网页。例:   京东商品详情页: https://item.jd.com/1138288.html https://item.jd.com/27305099378.html https://item.jd.com/46339353993.html   豆瓣电影详情页: https://movie.douban.com/subject/26387939/ https://…

2023年9月5日 0条评论 33点热度 0人点赞 365crawadmin 阅读全文

采集场景 在百度图片首页(http://image.baidu.com/)输入关键词搜索,采集得到的图片地址。示例是搜索关键词【三清山】得到的图片。   采集字段 搜索关键词、图片地址、图片保存文件路径。   鼠标放到图片上,右键,选择【在新标签页中打开图片】可查看高清大图 下文其他图片同理   采集结果 采集结果可导出为Excel,CSV,HTML,数据库等多种格式。导出为Excel示例:     教程说明 本篇制作时间:2022/6/30    八爪鱼版本:V8.5.4 如果因网页改版造成网址或步骤无效,无法采…

2023年9月5日 0条评论 43点热度 0人点赞 365crawadmin 阅读全文

有的网页内存在一个或多个下拉框,需要先点击下拉框中的选项,然后再采集数据。     针对这种网页,在八爪鱼中如何处理呢?我们来看一下。   一、在一个下拉框中点击选项 示例网址:http://deal.ggzy.gov.cn/ds/deal/dealList.jsp   步骤一:输入网址 在八爪鱼首页中输入网址,自动打开网页     步骤二:建立【循环-切换下拉选项】 在这里,我们想点击【省份】下拉框中的选项进行筛选。 选中【省份】下拉框,在弹出的操作提示框中,选择【循环切换下拉列表选项】。 进入【循环列表】的设置…

2023年9月5日 0条评论 36点热度 0人点赞 365crawadmin 阅读全文
1303132333446