通过蜜蜂采集器手工录入网页数据并发布,解决对不同类型网站的少量数据摘录的需求。
蜜蜂采集器的使用教程 - 将采集数据发布到Word文档 蜜蜂采集器的采集数据,可以通过“发布到文件”来发布到Word文档。此外,也可以使用“发布到插件”的方式,通过插件发布到Word文档。这里仅介绍通过使用“发布到文件”方式来实现发布到Word文档的功能。 发布到Word文件 打开主菜单“发布”——“发布到文件”管理器。添加一个文件发布配置,其中的“输出文件名&…
采集器对加减乘除等运算功能支持不够,一般通过调用插件实现复杂功能。也有的采集器支持内置脚本引擎实现加减乘除运算。蜜蜂采集器在当前版本中增加了内置JavaScript脚本的支持,采用V8引擎执行JavaScript脚本,从而实现加减乘除等运算。
本文以微博评论的采集为例,简单介绍一下数据采集的分析思路,以及JSON数据的解析、发布到文件的文件模板编写等。 环境准备 VSCode: 全称Visual Studio Code,是微软公司开发的一款跨平台文本编辑器,支持多种语言和文件格式的编辑。下载地址:点击下载 蜜蜂采集器: 一款数据采集软件。 页面分析 使用浏览器打开微博热搜榜,打开其中一个热搜,进入后找到其中一个评论较多的微博文章页面(复制微博地址到新标签页中打开)。按F12打开浏览器的开发者工具。刷新页面,并不断下拉加载更多评论,再分析&ld…