HTML代码示例:<img src=***.png> 这是一个不正常的img标签。因为src的属性值没有使用引号括起来,导致标签处理时,勾选“文件与图片下载”之后,实际采集并没有下载图片。 解决方法: 转换为正常的img标签格式。对标签内容增加“标签数据二次处理”——“正则表达式替换”,并填入正则表达式:<img src=([^'"<>\s]{1,250})(.*?)>,替换为<…
HTML代码示例:<img src=***.png> 这是一个不正常的img标签。因为src的属性值没有使用引号括起来,导致标签处理时,勾选“文件与图片下载”之后,实际采集并没有下载图片。 解决方法: 转换为正常的img标签格式。对标签内容增加“标签数据二次处理”——“正则表达式替换”,并填入正则表达式:<img src=([^'"<>\s]{1,250})(.*?)>,替换为<…
采集场景 在百度图片首页(http://image.baidu.com/)输入关键词搜索,采集得到的图片地址。示例是搜索关键词【三清山】得到的图片。 采集字段 搜索关键词、图片地址、图片保存文件路径。 鼠标放到图片上,右键,选择【在新标签页中打开图片】可查看高清大图 下文其他图片同理 采集结果 采集结果可导出为Excel,CSV,HTML,数据库等多种格式。导出为Excel示例: 教程说明 本篇制作时间:2022/6/30 八爪鱼版本:V8.5.4 如果因网页改版造成网址或步骤无效,无法采…
此插件集成平台为:佐糖去水印官网 (若有其他更常用平台,可以联系客服推荐评估~) 使用方法为:在火车采集器的根目录下,有DelWatermark.txt 文件,若没有可以自己手动新建 文本中内容为 wxz0XXXXXXXXoue2x#[{"x":0,"y":0,"width":380,"height":200}] 下面介绍下文档中各项内容涵义: ①# 号…
FTP/SFTP在火车采集器中设置其实很简单,但是网站种可能有很多不同的要求,下面详细介绍下设置方式以及可能出现的问题的处理方案,因FTP与SFTP在火车采集器中设置或者原理都是相同的,所以接下来的介绍不再区分称呼,统一简称为FTP: 一.图片的上传