在设置采集任务的过程中,有时候我们会遇到一些不需要采集的数据,如某些数值为空的数据或者包含某些字符的数据,从而在一定程度上影响了采集速度和效果,针对这种情况我们可以使用数据筛选功能,避免采集到无效数据。 智能模式中,“数据筛选”功能按钮在任务操作栏的右上角,点击之后会打开筛选条件设置窗口,如下图所示。 流程图模式中,“数据筛选”功能在提取数据组件菜单栏的右上角,,点击之后会打开筛选条件设置窗口,如下图所示。(如果流程图中有多个提取数据组件,数据筛选是共享的,在任意一个提取数据组件中打开设置都可以) 在数据筛选功能界…

2023年9月5日 0条评论 32点热度 0人点赞 365crawadmin 阅读全文

启动任务设置完毕之后,我们点击“启动”按钮。 然后会打开任务运行界面,在这个界面上我们可以查看网页、查看运行日志、查看采集结果、开启自动导出、开启加速、暂停任务或者停止任务。 1、查看网页 点击页面上的“查看网页”按钮,可以在新打开的窗口中查看当前正在采集的网页。 在这个界面中,我们点击右上角的保存按钮,可以把这个网页保存下来,一般用于需要保存当前网页来排查遇到的问题。 2、运行日志 点击“运行日志”可以查看当前任务的运行状态。 3、查看采集结果 点击“数据”可以预览当前任务的部分采集结果。 4、暂停 点击“暂停”…

2023年9月5日 0条评论 68点热度 0人点赞 365crawadmin 阅读全文

插件下载地址:点击下载插件 在火车采集器中如何安装智能原创插件 第一步,使用解压软件,提取插件安装包中的文件,解压到一个文件夹中。 第二步,打开解压后的文件夹,将里面的【5118 智能原创.dll】文件,放入在【火车采集器】安装目录下的Plugins文件夹里。 第三步,将文件夹中的【5118智能原创配置工具.exe】和【Newtonsoft.Json.dll】以及【Plugin_Helper.dll】文件,放入在【火车采集器】安装目录中。 第四步,在【火车采集器】的根目录里,打开【5118 智能原创配置工具.exe…

2023年9月4日 0条评论 68点热度 0人点赞 365crawadmin 阅读全文