蜜蜂采集器的使用教程 - 采集一次再发布到多个站点的几种方法
在数据采集过程中,常常需要将采集的内容发布到多个不同的站点,但各个站点的CMS、插件等可能各有不同,从而导致发布的数据格式也有所差异。对此,我们一般可以采取以下几种方法。
主站采集、子站复制
从数据源采集数据并发布到主站后,再从主站采集并发布到其他子站。其优点是简单明了,方法统一。但缺点也很明显,采集会消耗更多的系统资源,同时维护繁琐。一旦主站更换主题或优化页面布局,可能会导致子站数据出错,维护工作量较大。
一次采集多站发布,站点发布模块中对标签数据二次处理
从数据源采集数据,并同时发布到多个站点。但是,在各个站点发布模块中,需要对标签数据进行字段值二次处理,以使发布的内容符合相应的CMS和插件的格式要求。但站点发布模块的修改可能会影响到其他采集规则。
一次采集多站发布,站点发布模块中对标签重命名
从数据源采集数据,并同时发布到多个站点。但是,在各个站点发布模块中,需要对标签进行重命名。例如,“内容”标签在站点发布模块A中更名为“内容A”,在站点发布模块B中更名为“内容B”。而采集规则也将生成相应格式的“内容A”和“内容B”标签。但站点发布模块的修改可能会影响到其他采集规则。
一次采集多站发布,“发布到站点”的配置中使用“标签名称映射”
从数据源采集数据,并同时发布到多个站点。但是,在各个“发布到站点”的配置中使用“标签名称映射”。例如,“内容B”标签在发布到站点B的配置中,标签名称映射为“内容”。而采集规则中也生成“内容B”标签的对应格式。这样,就无需修改站点发布模块,就能实现一采多发的功能。
蜜蜂采集器2401版本新增了标签名称映射功能,这是一个非常实用的特色功能,我们真诚地邀请您进行试用。
文章评论