火狐浏览器firebug和firepath插件安装方法(最新)。以下为具体步骤。   第1步:下载火狐55以内版本安装包,安装时迅速设置禁止自动更新版本,取消勾选自动更新(目的是防止火狐浏览器自动升级)   54版本火狐浏览器的下载地址:64位火狐54:http://ftp.mozilla.org/pub/firefox/releases/54.0.1/win64/zh-CN/ 32位火狐54:http://ftp.mozilla.org/pub/firefox/releases/54.0.1/win32/zh-C…

2023年9月5日 0条评论 44点热度 0人点赞 365crawadmin 阅读全文

XPath对于八爪鱼数据采集十分重要。绝大多数的数据采集问题,都可以通过写一条正确的XPath解决。 本课将详细讲解XPath相关的问题。    一、HTML 与 XPath   我们日常浏览的网页本质上都是一个个HTML文档。打开网页后,鼠标右键打开菜单,选择【查看网页源代码】,就能看到该网站的HTML文档。网页上的数据,在其HTML文档中都有一个对应位置。     鼠标放到图片上,右键,选择【在新标签页中打开图片】可查看高清大图 下文其他图片同理   如何在HTML文档中找到想要的数据?XPath是最常用的语言…

2023年9月5日 0条评论 27点热度 0人点赞 365crawadmin 阅读全文

采集场景 采集采集游天下不同城市的租房信息。   采集字段 城市、标题、出租人、地址、价格、标题链接、坐标等。     点击图片可查看高清大图,下文其他图片同理    采集结果 采集结果可导出为Excel,CSV,HTML,数据库等多种格式。导出为Excel示例:     教程说明 本篇制作时间:2022/06/20    八爪鱼版本:V8.5.2 目标数据,请联系官方客服,我们将及时修正。   采集步骤   步骤一、打开网页 步骤二、提取数据 步骤三、创建【循环列表】 步骤四、提取数据 步骤五、启动采集   以下…

2023年9月5日 0条评论 24点热度 0人点赞 365crawadmin 阅读全文

我们通过创建【循环列表】去采集多个列表或详情页的数据。创建【循环列表】的方式在 新手入门系列课程 中有详细讲过。   一般情况下,通过以上方法创建的【循环列表】不会出错,能够精准采集到我们想要的全部数据。但有时候也会遇到一些问题:比如滚动后加载出100个列表,为什么只采集到20个?有一些列表并不是我们需要的,如何将其排除掉? 页面本来有30条列表,为什么却只能采集到10条?   这时候,就需要手动修改XPath去精准定位列表。   以下通过实例进行说明。   实例网址:https://www.made-in-chi…

2023年9月5日 0条评论 30点热度 0人点赞 365crawadmin 阅读全文

我们通过创建【循环列表】去采集多个列表或详情页的数据。创建【循环列表】的方式在 新手入门系列课程 中有详细讲过。     一般情况下,通过以上方法创建的【循环列表】不会出错,能够精准采集到全部数据。但有时候也会遇到一些问题:比如列表中有的部分不是我们想要的,需要进行丢弃。   这时候,可以手动修改XPath去定位列表丢弃不需要的部分。也可以用分支判断丢弃。     以下通过实例进行说明。   实例网址:https://weibo.com/2803301701?refer_flag=1001030103_     一…

2023年9月5日 0条评论 28点热度 0人点赞 365crawadmin 阅读全文

我们通过创建【循环列表】去采集多个列表或详情页的数据。创建【循环列表】的方式在 新手入门系列课程 中有详细讲过。     一般情况下,通过以上方法创建的【循环列表】不会出错,能够精准采集到全部数据。 但有时候我们点击了列表页某一项数据之后,点击“选中全部”,但是循环定位到的数据并没有包含咱们要的所有数据项,这个时候可以通过手动修改xpath,让循环定位到咱们所有需要的数据, 这就是我们本节课所要讲的内容。   实例网址:https://www.haodf.com/hospital/list.html   基础操作:…

2023年9月5日 0条评论 23点热度 0人点赞 365crawadmin 阅读全文

采集场景 58同城的民宿短租版块,发布民宿短租的房源信息。本篇教程将详细讲解如何采集这些房源信息,并支持切换城市采集。   采集字段 城市、标题、出租人、位置、价格、标题链接、坐标等。     采集结果 采集结果可导出为Excel,CSV,HTML,数据库等多种格式。导出为Excel示例:     教程说明 本篇更新时间:2021/1/13   八爪鱼版本:V8.2.6 如果因网页改版造成网址或步骤无效,无法收集到目标数据,请联系官方客服,我们将及时修正。   采集步骤 步骤一:打开网页 步骤二、提取数据 步骤三、…

2023年9月5日 0条评论 25点热度 0人点赞 365crawadmin 阅读全文

采集场景 采集黄河口信息港的短租房信息。   采集字段 区域、标题、标题链接、出租人、价格、位置等。     点击图片可查看高清大图,下文其他图片同理    采集结果 采集结果可导出为Excel,CSV,HTML,数据库等多种格式。导出为Excel示例:     教程说明 本篇制作时间:2021/1/13    八爪鱼版本:V8.2.6 如果因网页改版造成网址或步骤无效,无法采集到目标数据,请联系官方客服,我们将及时修正。   采集步骤   步骤一、打开网页 步骤二、自动识别 步骤三、设置点击步骤,进入详情页 步骤…

2023年9月5日 0条评论 43点热度 0人点赞 365crawadmin 阅读全文

在学习本教程之前,您需要具备八爪鱼基础操作和XPath相关知识,如果还未掌握,请先学习以下课程。 自定义模式入门:https://www.bazhuayu.com/tutorial8/xsrm/81zdyrm XPath 系统学习与实例:https://www.bazhuayu.com/tutorial8/81xpath   一、相对XPath 相对Xpath,即相对于循环框的Xpath,有两个典型特征:跟随循环联动;与循环框的XPath合并成一条完整的定位XPath。 有两种常见应用场景:提取循环内的数据;提取循…

2023年9月5日 0条评论 38点热度 0人点赞 365crawadmin 阅读全文

采集场景 点击房天下网站的【二手房】分类,采集【二手房】分类下的房屋数据。 采集时可选择目标城市,本示例以深圳二手房为例:https://sz.esf.fang.com 。   采集字段 房源名称、房屋介绍、联系人、售价、所在小区、具体地址、单位价格等。   点击查看高清大图,下文其他图片同理     采集结果 采集结果可导出为Excel、CSV、HTML、数据库等多种格式。导出为Excel示例:     教程说明 本篇制作时间:2022/6/29   八爪鱼版本:V8.5.4 如果因网页改版造成网址或步骤无效,无…

2023年9月5日 0条评论 43点热度 0人点赞 365crawadmin 阅读全文
1333435363746