火车采集器二级代理功能,默认是会对获取的代理IP进行一个验证,验证IP是否起效,这样有助于进行IP的筛选,剔除失效IP。 但有些客户有一些特殊的需求,并不需要提前验证IP的真实性,因此开发出这种免验证代理IP的功能,导入的IP直接就显示通过的状态,不会通过我们软件自带的验证功能,导入的IP立刻就能使用,及时性更高。
火车采集器二级代理功能,默认是会对获取的代理IP进行一个验证,验证IP是否起效,这样有助于进行IP的筛选,剔除失效IP。 但有些客户有一些特殊的需求,并不需要提前验证IP的真实性,因此开发出这种免验证代理IP的功能,导入的IP直接就显示通过的状态,不会通过我们软件自带的验证功能,导入的IP立刻就能使用,及时性更高。
火车采集器企业版本软件是专门提供给多人协同使用的版本,因此有多种便于管理的功能,而其中的远程管理功能是其中的重要功能点。 远程管理功能使用方便,但是一开始的接口界面较简单,因此在此次V9版本中做了一个较大的改版,将界面、性能以及功能都做了优化改动,下面介绍下详细的功能介绍以及使用方法。 一.功能介绍 远程管理功能允许用户在本地启动一个服务接口,该接口可以实现对火车采集器的软件的远程管理,比如对任务进行新建、…
当火车采集器旧版本使用了9.7.1及以上版本导出的规则时,若出现了以下错误: 有两种解决方法: (1)下载最新版本使用。可以直接覆盖旧版本使用,这样不用再进行数据迁移,但是要注意旧版本要注意备份,以防数据丢失哦~~ (2) 出现这个错误的原因,是因为9.7.1的数据处理的html标签排除中加了新的标签排除项,可以先将这个“HTML标签排除”处理步骤删除,然后在旧版本中重新添加这个步骤即可~
出现这种问题一般是由于系统的原因,下面介绍针对这种情况的解决方法: 一.由于IE未启动服务,以及.net版本不支持,下面介绍具体设置方法: (1)如下图配置IE。 (2)安装.net4.0 ,安装完成后重启电脑,然后再测试下网站是否能够采集
sqlite中设置自增ID后,自增ID已经记录,就算清空已经采集的内容,再次采集时,自增ID也是从上一次的ID后递增,想要重置自增ID从零开始,需要按以下步骤设置: (1)首先清空采集所有内容 (2) 在本地编辑数据库的执行sql语句中运行语句即可: UPDATE sqlite_sequence SET seq =0 WHERE name ='Content' 注意:(1)本方法只针对sqlite (2)运行该语句前,需要先清空采集器中已采集数据
语法测试时提示以上错误提示,是因为程序集没有引用,下面介绍下解决方法: 1.linq程序集 在工具→点击引用,选择system.Linq.dll 2.regularExpressions程序集引用 如上图,观察下程序集的路径,并在浏览选项框中找到该路径,并选择system.dll 然后重新语法测试一下,可以看到一切运行正常。如果之后再显示有程序集缺少,那可以按照system.dll的添加方式来引用下程序集
“火车伪原创插件.dll” 文件放到Plugins目录下。 “火车伪原创插件配置工具.exe” 文件放在采集器根目录下,和LocoySpider.exe放在同一目录。 通过使用配置工具来 填写账号、密码等信息即可。 新建任务,创建"标题"和"内容"标签, 然后在其他设置中->插件->采集结果处理插件,选择"火车伪原创插件.dll"即可。 下载链接:点击打开链接 注意: (1)若是运行插件时出现如下…
最新版的采集器中新增加了对于http二级代理的API请求功能,下面介绍一下这个功能如何添加。 首先您需要找到一家代理IP,该代理需提供通过API获取IP的功能,下面来设置http功能 1.打开http二级代理服务器,点击批量导入。 2.点击添加按钮。直接将生成的API地址放入火车采集器地址栏处(图中画圆圈处)注意,生成的API必须是json格式,若是提供的默认正则格式不能正确获取到代理,那么需要您根据获取的Ip格式重新编写匹配正则表达式 3.勾选开启定时刷新,设置好时间后采集器会定时请求API来获取最新的IP地址。…