采集场景
我们一般通过搜狗微信(https://weixin.sogou.com/),去采集微信公众号文章。搜狗微信支持【公众号搜索】,通过输入公众号名称/ID,可搜索到目标公众号,查看目标公众号相关信息(公众号ID、微信号、功能介绍、微信认证)和其最新发布的一篇文章(文章标题和文章链接),点击文章链接可进入文章详情页,查看文章正文(文字+图片)。
采集字段
公众号名称、微信号、功能介绍、微信认证公司名、文章标题、文章来源、文章作者、发布日期、文章正文。
鼠标放到图片上,右键,选择【在新标签页中打开图片】可查看高清大图
以下图片同理
采集结果
采集结果可导出为Excel,CSV,HTML,数据库等多种格式。导出为Excel示例:
采集步骤
步骤一:打开网页
步骤二、批量输入多个关键词并搜索
步骤三、采集公众号信息
步骤四、点击进入最近文章详情,采集文章正文
步骤五、编辑字段
步骤六、启动采集
以下为具体步骤:
步骤一、打开网页
在首页【输入框】中输入目标网址 https://weixin.sogou.com,点击【开始采集】,八爪鱼自动打开网页。
特别说明:
a. 打开网页后,如果开始开始【自动识别】,请点击【不再自动识别】或【取消识别】将其关掉。因为本文不适合使用【自动识别】。
b. 【自动识别】适用于自动识别网页上的列表、滚动和翻页,识别成功后直接启动采集即可获取数据。详情点击查看 【自动识别】教程
文章评论