蜜蜂采集器的新功能介绍,POST请求和文件上传变量的解析。  

2023年9月5日 0条评论 44点热度 0人点赞 365crawadmin 阅读全文

HTML代码示例:<img src=***.png> 这是一个不正常的img标签。因为src的属性值没有使用引号括起来,导致标签处理时,勾选“文件与图片下载”之后,实际采集并没有下载图片。 解决方法: 转换为正常的img标签格式。对标签内容增加“标签数据二次处理”——“正则表达式替换”,并填入正则表达式:<img src=([^'"<>\s]{1,250})(.*?)>,替换为<…

2023年9月5日 0条评论 55点热度 0人点赞 365crawadmin 阅读全文

站点发布模块的编写方法,发布模块的内置文件上传功能介绍。  

2023年9月5日 0条评论 28点热度 0人点赞 365crawadmin 阅读全文

蜜蜂采集器的POST方法采集数据,POST采集时的请求参数处理。  

2023年9月5日 0条评论 58点热度 0人点赞 365crawadmin 阅读全文

蜜蜂采集器的备份与恢复功能介绍。  

2023年9月5日 0条评论 117点热度 0人点赞 365crawadmin 阅读全文

爬取地图商户(餐馆)信息。  

2023年9月5日 0条评论 28点热度 0人点赞 365crawadmin 阅读全文

2023年9月5日 0条评论 46点热度 0人点赞 365crawadmin 阅读全文

蜜蜂采集器的使用教程 - 对HTTP/2和HTTP/3的功能支持 HTTP的发展历史 HTTP(超文本传输协议)是万维网(World Wide Web)的基础协议。自 Tim Berners-Lee 博士和他的团队在 1989-1991 年间创造出它以来,HTTP 已经发生了太多的变化,在保持协议简单性的同时,不断扩展其灵活性。如今,HTTP 已经从一个只在实验室之间交换文件的早期协议进化到了可以传输图片,高分辨率视频和 3D 效果的现代复杂互联网协议。 最早版本是1991年发布的0.9版。最初版本的 HTTP 协…

2023年9月5日 0条评论 66点热度 0人点赞 365crawadmin 阅读全文

本例演示的是文件下载、FTP文件上传等功能。 分析 打开某网站移动版的热搜榜单,网址为 https://m.---.cn/?vt=4&pos=108&sudaref=sina.cn 。通过浏览器的开发者工具,可以看到网络请求 https://m.---.cn/api/container/getIndex?containerid=102803&openApp=0 为榜单内容,json格式。 采集规则 新建一个采集规则,命名为“图片下载测试&r…

2023年9月5日 0条评论 40点热度 0人点赞 365crawadmin 阅读全文

意大利米兰家具展览会参展商企业目录名称的采集,网址采集中的POST翻页采集方法,JSON数据解析方法,内容发布到Excel文件。  

2023年9月5日 0条评论 49点热度 0人点赞 365crawadmin 阅读全文
1131415161754