蜜蜂采集器的采集数据,有几种方法导出到PDF文件。一种是数据编辑窗口的“导出当前页记录”,一种是“发布到文件”中添加文件发布模板。此外,也可以使用“发布到插件”的方式,通过插件发布到PDF文件。
蜜蜂采集器的采集数据,有几种方法导出到PDF文件。一种是数据编辑窗口的“导出当前页记录”,一种是“发布到文件”中添加文件发布模板。此外,也可以使用“发布到插件”的方式,通过插件发布到PDF文件。
翻译功能,一般是调用第三方API。大概流程是,在一些提供翻译服务的站点注册帐号,然后申请API权限,之后再调用其API接口或SDK,即可实现翻译功能。 一般情况下,这些翻译机构都提供一定的免费额度,超出部分会按字数收费。 本文以蜜蜂采集器为例,调用百度翻译接口,实现文本翻译功能。 插件介绍 蜜蜂采集器的插件功能,分为列表页网址插件、数据处理插件、标签数据处理插件、文件上传插件、内容发布插件、消息通知插件。每一种插件都支持PHP、Python、Nodejs、Go四种编程语言。 其中,数据处理插件是在一条采集记录中的所…
有些网页会使用JavaScript的加密库Crypto-JS来加密网页数据,如果使用常规的思路进行处理,则非常麻烦,耗时耗力。这里介绍一种可以在蜜蜂采集器中使用的解密方法,供大家参考。
现在很多网站采用异步请求方式来展现网页内容,而异步请求中的内容多为JSON格式。如果采用可视化采集技术,则要展示这样的页面内容,需要先加载各种css、js文件,速度较慢,网页的可视化展示也比较占用系统资源;采集网页过程中页面呈现可能偶尔会卡住,也非常影响体验。 对这种JSON格式异步数据的采集,如果采用传统采集方式,使用JSON表达式解析,也可以很方便。 下面以同花顺的“7×24小时要闻直播”为例,使用蜜蜂采集器进行简单的采集测试。 我们先使用浏览器访问同花顺的“7&…
蜜蜂采集器的使用教程 - 实现博客搬家 博客,即网络日志,是一种通过互联网发布个人或团体的观点、经验、知识等内容的方式。当前,除了传统的文字和图片形式的博客外,还出现了一些新颖和有趣的博客形式,如视频博客(Vlog)、音频博客(Podcast)、动画博客(Animation Blog)等。 博客搬家,就是将博客从一个平台或者域名迁移到另一个平台或者域名的过程。博客搬家的原因有很多,比如平台的性能、稳定性、功能、设计、商业化等方面的不满意,或者个人的喜好、需求、目标等方面的变化。 十多年前,博客市场格局基本定型,一些…
蜜蜂采集器的使用教程 - 使用JavaScript内置脚本引擎进行加减乘除运算 采集器对加减乘除等运算功能支持不够,一般通过调用插件实现复杂功能。也有的采集器支持内置脚本引擎实现加减乘除运算。蜜蜂采集器在当前版本中增加了内置JavaScript脚本的支持,采用V8引擎执行JavaScript脚本,从而实现加减乘除等运算。 本文以高赞评论的采集与分析为例,演示如何使用蜜蜂采集器的内置JavaScript脚本功能。 需求说明 很多短视频或文章评论下,都会有一些高赞评论。那么,这些高赞评论都有哪些特征呢?如何才…
采集器对加减乘除等运算功能支持不够,一般通过调用插件实现复杂功能。也有的采集器支持内置脚本引擎实现加减乘除运算。蜜蜂采集器在当前版本中增加了内置JavaScript脚本的支持,采用V8引擎执行JavaScript脚本,从而实现加减乘除等运算。