采集场景 在携程网点击【攻略】-【目的地攻略】- 【选择目的地】-【选择景点】,采集目的地景点下的评论。 示例网址:https://you.ctrip.com/sight/bole922/5500.html               https://you.ctrip.com/sight/lijiang32/3049.html   采集字段 景点名、级别、总评分、评论数、景点地址、开放时间、景点介绍、整体景色、整体趣味、整体性价比、用户名、评分、景色、趣味、性价比、评论正文、评论时间。     点击查看高清大图,…

2023年9月5日 0条评论 39点热度 0人点赞 365crawadmin 阅读全文

采集场景 在百度首页 https://www.baidu.com/  输入关键词搜索,采集搜索后得到的搜索结果。     采集字段 标题、网页链接、简介   采集结果 采集结果可导出为Excel,CSV,HTML,数据库等多种格式。导出为Excel示例:     教程说明 本篇更新时间:2022/6/9    八爪鱼版本:V8.5.2 如果因网页改版造成网址或步骤无效,无法采集到目标数据,请联系官方客服,我们将及时修正。   采集步骤 步骤一、打开网页 步骤二、批量输入多个关键词并搜索 步骤三、创建【循环翻页】,采…

2023年9月5日 0条评论 37点热度 0人点赞 365crawadmin 阅读全文

采集场景 孔夫子旧书网有非常多的类目,本教程讲解如何分类目采集图书列表页数据。 示例网址 http://book.kongfz.com/Cjishu/n1004000000/ 是【图书-工程技术-改革开放与80年代】类目的网址。   采集字段 书名、出版社、店铺名称、发货地址、品相、售价等字段。       点击查看高清大图,下文其他图片同理     采集结果 采集结果可导出为Excel、CSV、HTML、数据库等多种格式。导出为Excel示例:     教程说明 本篇制作时间:2022/6/08   八爪鱼版本:…

2023年9月5日 0条评论 22点热度 0人点赞 365crawadmin 阅读全文

采集场景 采集Amazon商品详情页数据。Amazon商品详情页实例网址:https://www.amazon.com/dp/B07R7DY911。   采集字段 title、brand、stars、ratings、questions、price、details、productdimensions、itemweight、shippingweight、asin、itemmodelnumber、bestsellerrank、stock 等。   鼠标放到图片上,右键,选择【在新标签页中打开图片】可查看高清大图 下文其他…

2023年9月5日 0条评论 29点热度 0人点赞 365crawadmin 阅读全文

什么是防采集?   用大白话来说,就是我们想利用工具采集某个网站的数据(前提当然是公开合法数据),但网站不想给你采集而设置的技术阻挡措施。     网站常见的防采集套路有哪些?     防采套路1:输入验证码框验证   采集难度:★☆☆☆☆ 常见网站:搜狗微信   在采集某些网站过程中,爪子们是不是经常会遇到这样的情况,要求你输入验证码,否则就卡住进行不下去?   对的,这是网站最常用且最基础的防采措施之一,它要求你必须你手动输入验证码里的数字和字母,才能继续看到更多信息或者进行下一步,以此来判断你是机器人还是真人…

2023年9月5日 0条评论 26点热度 0人点赞 365crawadmin 阅读全文

云采集排错教程   本教程针对本地采集有数据,云采集没有数据的排错教程,如果本地采集没有数据,请先参考本地采集排错教程 本地采集有数据,云采集没有数据主要原因为以下几点:   1.防采集 2.网站或网速原因 3.网络环境不同,源码有变,原xpath定位不准 4.网站只允许单浏览器或单IP登录     一、防采集 防采集主要是以下三类:IP被封禁止访问、出现验证码、云上需要登录 针对以上三种情况,都可以通过采集网页的html源码进行观察,这里我们以百姓网招聘数据采集为例。如下图1所示启动云采集后子任务出现采集为0的情…

2023年9月5日 0条评论 30点热度 0人点赞 365crawadmin 阅读全文

八爪鱼采集到的数据,支持导出到SqlServer数据库中。可手动导出,也按照设置的定时导出计划,自动导出。 本教程将以云采集数据,演示手动/自动导出到SqlServer数据库中的具体步骤。   一、手动导出具体步骤   在任务采集完毕之后,将采集得到的数据,手动导出到数据库中。 本地采集和云采集数据,均可手动导出。   Step1:先在您的SqlServer数据库中,建好数据库和数据表。   Step2:在【我的任务】中,选择一个要导出的任务,点击【更多操作】→【查看数据】→【云采集数据】,找到此任务已采集到的云数…

2023年9月5日 0条评论 35点热度 0人点赞 365crawadmin 阅读全文

采集场景 58同城的民宿短租版块,发布民宿短租的房源信息。本篇教程将详细讲解如何采集这些房源信息,并支持切换城市采集。   采集字段 城市、标题、出租人、位置、价格、标题链接、坐标等。     采集结果 采集结果可导出为Excel,CSV,HTML,数据库等多种格式。导出为Excel示例:     教程说明 本篇更新时间:2021/1/13   八爪鱼版本:V8.2.6 如果因网页改版造成网址或步骤无效,无法收集到目标数据,请联系官方客服,我们将及时修正。   采集步骤 步骤一:打开网页 步骤二、提取数据 步骤三、…

2023年9月5日 0条评论 24点热度 0人点赞 365crawadmin 阅读全文

采集场景 在天眼查搜索页面(https://www.tianyancha.com/search),选择条件查询,得到条件查询后的结果列表页。实例网址:https://www.tianyancha.com/search?base=bj&companyType=normal_company,是选择了2个查询条件(省份地区:北京市;机构类型:企业)后得到的列表页。然后点击企业链接进入详情页,采集企业详情页的数据。     鼠标放到图片上,右键,选择【在新标签页中打开图片】可查看高清大图 下文其他图片同理   采集…

2023年9月5日 0条评论 76点热度 0人点赞 365crawadmin 阅读全文

 经过前几课的学习,我们已经掌握了列表数据、表格数据、点击多个链接后的详情页数据、实现翻页 的任务配置方法。   在此基础上,本课将详解八爪鱼的采集原理和流程执行逻辑,让大家对八爪鱼采集数据的方法有一个更深入的理解。   一、八爪鱼采集原理   1、模拟人的行为,通过内置Chrome浏览器浏览网页数据。   所以采集数据的第一步永远是找到目标网址并输入。这跟通过普通浏览器访问网页完全一样。 在普通浏览器中需要点击链接进入详情、点击翻页按钮查看更多数据,在八爪鱼中也需如此操作。   2、根据网页特性和采集需求,设计采…

2023年9月5日 0条评论 34点热度 0人点赞 365crawadmin 阅读全文
14567813