有时候我们需要将采集的数据保存到Excel表格中。此前,我们介绍了怎样导出采集数据到Excel表格(csv格式),现在我们的新版本增加了对xlsx格式的支持,可以把采集到的数据发布成xlsx格式的Excel表格文件。  

2024年2月28日 0条评论 96点热度 0人点赞 365crawadmin 阅读全文

蜜蜂采集器的使用教程 - 将采集数据发布为xlsx格式的Excel表格文件 有时候我们需要将采集的数据保存到Excel表格中。此前,我们介绍了怎样导出采集数据到Excel表格(csv格式),现在我们的新版本增加了对xlsx格式的支持,可以把采集到的数据发布成xlsx格式的Excel表格文件。 发布到文件(Excel格式) 进入主菜单,选择“发布”选项,然后再选择“发布到文件”管理器。在管理器中添加一个文件发布配置,将“输出文件名”设置为蜜蜂采集…

2024年2月26日 0条评论 80点热度 0人点赞 365crawadmin 阅读全文

2023.12新增了网盘检测工具,以至于没能在12月发布蜜蜂采集器PC版1.6版本。 目前的计划安排。我们一直希望优先加入可视化采集的功能,但考虑到工作量较大,加上当前版本bug较多,且一直未处理,所以,还是以bug为主、新功能为辅。但2024年上半年,我们大概率会加上可视化采集功能。当然,不太可能会像其他采集器那样偏重于可视化采集,我们还是以可视化采集为辅,用户还是需要了解基本上的HTML知识。这将是我们今后一段时间内的首要工作,在此之前,很可能不再发布新版本。 因此,1.6版本将很可能是未来半年内的唯一一次更新…

2024年2月19日 0条评论 96点热度 0人点赞 365crawadmin 阅读全文

2024.1.30 百度网盘链接有效性检测工具更新到1.1版本,界面字体改为13号,修复几处功能性问题。 蜜蜂采集器更新到1.6版本。1.6版本是至今为止第一个较稳定版本,欢迎升级使用。 蜜蜂采集器v1.6.2401.26854版本更新简要列表:1. 优化:默认字体大小从14改为13。2. 增加:批量访问网址的功能。3. 增加:采集规则中的网址源之Excel文件源(xlsx文件)的支持。4. 增加:采集规则中的内容发布之发布到Excel文件(xlsx文件)的支持。5. 增加:站点发布配置的标签映射功能。6. 增加:…

2024年2月19日 0条评论 138点热度 0人点赞 365crawadmin 阅读全文

蜜蜂采集器的使用教程 - 采集一次再发布到多个站点的几种方法 在数据采集过程中,常常需要将采集的内容发布到多个不同的站点,但各个站点的CMS、插件等可能各有不同,从而导致发布的数据格式也有所差异。对此,我们一般可以采取以下几种方法。 主站采集、子站复制 从数据源采集数据并发布到主站后,再从主站采集并发布到其他子站。其优点是简单明了,方法统一。但缺点也很明显,采集会消耗更多的系统资源,同时维护繁琐。一旦主站更换主题或优化页面布局,可能会导致子站数据出错,维护工作量较大。 一次采集多站发布,站点发布模块中对标签数据二次…

2024年2月19日 0条评论 87点热度 0人点赞 365crawadmin 阅读全文

蜜蜂采集器2401版本新增了标签名称映射功能,轻松实现一采多发功能。使用蜜蜂采集器实现“采集一次再发布到多个站点”的几种方法。  

2024年2月19日 0条评论 73点热度 0人点赞 365crawadmin 阅读全文

2311版本新增TCP网络请求测试工具,修复内存泄露等问题。  

2023年12月13日 0条评论 56点热度 0人点赞 365crawadmin 阅读全文

python 中的split()函数通过使用指定的分隔符拆分原始字符串来帮助返回字符串列表。 **str.split([separator [, maxsplit]])** #where separator may be a character,symbol,or space 分割()参数: split()函数接受两个参数。如果没有给定分隔符参数,它将接受任何空白(空格、换行符等)。)作为分隔符。 参数 描述 必需/可选 分离器 它是一个分隔符。字符串在指定的分隔符处拆分。 可选择的 maxsplit maxspl…

2023年10月27日 0条评论 47点热度 0人点赞 365crawadmin 阅读全文

python 中的rsplit()函数通过拆分原始字符串来帮助返回字符串列表。这里的拆分是从右端开始,并使用指定的分隔符。 **str.rsplit([separator [, maxsplit]])** #where separator may be a character,symbol,or space rsplit()参数: rsplit()函数接受两个参数。如果没有给定分隔符参数,它将接受任何空白(空格、换行符等)。)作为分隔符。 参数 描述 必需/可选 分离器 它是一个分隔符。字符串在指定的分隔符处拆分。…

2023年10月27日 0条评论 50点热度 0人点赞 365crawadmin 阅读全文

python 中的splitlines()函数有助于返回字符串中的行列表,这里的拆分是在换行符处完成的。它以布尔值作为参数。 **str.splitlines([keepends])** #where keepends is a boolean value 分割线()参数: splitlines()函数接受一个参数。默认情况下,不提供换行符。换行符也包含在列表的项目中,它可以是以下任何一种。 | \n | 换行 | | \r | 回车 | | \r\n | 回车+换行 | | \v 或 \x0b | 行列表 | |…

2023年10月27日 0条评论 61点热度 0人点赞 365crawadmin 阅读全文
1234530