采集场景 进入搜狗微信首页,(https://weixin.sogou.com/),采集【热门】分类下的文章列表数据。同时,点击每一篇文章的链接,进入文章详情页,采集文章正文和图片。   采集字段 标题、文章链接、封面图、简介、来源、发布时间、正文、图片链接。       鼠标放到图片上,右键,选择【在新标签页中打开图片】可查看高清大图 下文其他图片同理    采集结果 采集结果可导出为Excel、CSV、HTML、数据库等多种格式。导出为Excel示例:     教程说明 本篇制作时间:2020/4/24    …

2023年9月5日 0条评论 39点热度 0人点赞 365crawadmin 阅读全文

采集场景 我们一般通过搜狗微信(https://weixin.sogou.com/),去采集微信公众号文章。搜狗微信支持【公众号搜索】,通过输入公众号名称/ID,可搜索到目标公众号,查看目标公众号相关信息(公众号ID、微信号、功能介绍、微信认证)和其最新发布的一篇文章(文章标题和文章链接),点击文章链接可进入文章详情页,查看文章正文(文字+图片)。   采集字段 公众号名称、微信号、功能介绍、微信认证公司名、文章标题、文章来源、文章作者、发布日期、文章正文。     鼠标放到图片上,右键,选择【在新标签页中打开图片…

2023年9月5日 0条评论 32点热度 0人点赞 365crawadmin 阅读全文

采集场景 在知乎首页 https://www.zhihu.com/, 输入关键词搜索,得到相关问题列表。然后,点击问题链接进入详情页,采集该问题下的多个回答数据。   采集字段 问题名称、问题描述、评论数、问题网址、回答ID、回答ID描述、回答ID头像、回答正文等字段。     鼠标放到图片上,右键,选择【在新标签页中打开图片】可查看高清大图 下文其他图片同理     采集结果 采集结果可导出为Excel、CSV、HTML、数据库等多种格式。导出为Excel示例:     教程说明 本篇制作时间:2022/5/20…

2023年9月5日 0条评论 34点热度 0人点赞 365crawadmin 阅读全文

采集场景 在B站首页(https://www.bilibili.com/),输入关键词搜索,得到相关视频列表页,然后点击视频链接进入其详情页,采集视频详情页中的详细信息。 示例在首页输入关键词【vlog】搜索,得到搜索结果列表页网址:https://search.bilibili.com/all?keyword=vlog 。   采集字段 视频标题、总播放数、总弹幕数、发布时间、视频时长、点赞数、硬币数、收藏数、视频介绍、页面网址等字段。     鼠标放到图片上,右键,选择【在新标签页中打开图片】可查看高清大图 下…

2023年9月5日 0条评论 68点热度 0人点赞 365crawadmin 阅读全文

采集场景 采集B站UP主主页的视频列表数据。 示例网址: https://space.bilibili.com/33775467 https://space.bilibili.com/2282611 https://space.bilibili.com/21975459   采集字段 发布者、关注数、粉丝数、认证、UID、标题、视频连接、总播放数、发布时间、时长、视频封面链接   点击查看高清大图,下文其他图片同理     采集结果 采集结果可导出为Excel、CSV、HTML、数据库等多种格式。导出为Excel示…

2023年9月5日 0条评论 25点热度 0人点赞 365crawadmin 阅读全文

采集场景 打开B站详情页,采集视频详情页数据。 示例网址: https://www.bilibili.com/video/BV1ai4y1x7bB https://www.bilibili.com/video/BV1Wv411172X https://www.bilibili.com/video/BV17k4y117BJ   采集字段 标题、时长、发布时间、总播放数、总弹幕数、发布者、硬币、收藏量、点赞数、分享数、视频介绍、视频标签、评论数   点击查看高清大图,下文其他图片同理     采集结果 采集结果可导出为…

2023年9月5日 0条评论 60点热度 0人点赞 365crawadmin 阅读全文

采集场景 B站有非常多的分类(动画、音乐、舞蹈等),每个分类下都会很多热门标签。本教程采集热门分类下的视频列表数据。 标签示例网址: https://www.bilibili.com/v/douga/mad/?spm_id_from=333.5.b_7375626e6176.2#/4672 https://www.bilibili.com/v/music/cover/?spm_id_from=333.5.b_6d757369635f636f766572.23#/312357    采集字段 标签、视频时长、标题、视…

2023年9月5日 0条评论 19点热度 0人点赞 365crawadmin 阅读全文

采集场景 在爱采购搜索页面 https://b2b.baidu.com/c?q 输入关键词搜索,然后采集搜索后得到的多个厂家列表数据。   采集字段 厂家名称、主要产品、注册地址、营业期限、注册资本、实例商品价格等字段。   点击查看高清大图,下文其他图片同理     采集结果 采集结果可导出为Excel、CSV、HTML、数据库等多种格式。导出为Excel示例:     教程说明 本篇制作时间:2020/9/28   八爪鱼版本:V8.1.22 如果因网页改版造成网址或步骤无效,无法收集到目标数据,请联系官方客服…

2023年9月5日 0条评论 34点热度 0人点赞 365crawadmin 阅读全文

采集场景 在爱采购搜索页面 https://b2b.baidu.com/ 输入关键词搜索,然后采集搜索后得到的多个商品列表数据。   采集字段 商品名称、余量、产品标签、价格、产地、厂家名称、商品图片链接等字段。   点击查看高清大图,下文其他图片同理     采集结果 采集结果可导出为Excel、CSV、HTML、数据库等多种格式。导出为Excel示例:     教程说明 本篇制作时间:2022/6/15   八爪鱼版本:V8.5.2 如果因网页改版造成网址或步骤无效,无法收集到目标数据,请联系官方客服,我们将及…

2023年9月5日 0条评论 34点热度 0人点赞 365crawadmin 阅读全文

采集场景 孔夫子旧书网有非常多的类目,本教程讲解如何分类目采集图书列表页数据。 示例网址 http://book.kongfz.com/Cjishu/n1004000000/ 是【图书-工程技术-改革开放与80年代】类目的网址。   采集字段 书名、出版社、店铺名称、发货地址、品相、售价等字段。       点击查看高清大图,下文其他图片同理     采集结果 采集结果可导出为Excel、CSV、HTML、数据库等多种格式。导出为Excel示例:     教程说明 本篇制作时间:2022/6/08   八爪鱼版本:…

2023年9月5日 0条评论 22点热度 0人点赞 365crawadmin 阅读全文
1616263646579