以下是在使用后羿采集器过程中涉及到的一些名词。 采集规则: 这是后羿采集器记录采集任务的具体设置信息,并且能进行导入导出操作的一个程序脚本。导入已有的规则后既可以进行修改,也可以不做修改直接按照所配置的规则自动地进行数据采集,导出的规则可以发送给其他用户进行使用。   XPath: 这是一种路径查询语言,简单的说就是利用一个路径表达式找到我们需要的数据在网页中的位置。 以下简介来自百度百科,请点此查看更详细内容: XPath即为XML路径语言,它是一种用来确定XML(标准通用标记语言的子集)文档中某部分位…

2023年9月5日 0条评论 36点热度 0人点赞 365crawadmin 阅读全文

在后羿采集器中,采集任务的基础设置如下: 1、创建新任务 后羿采集器提供了任务的多种创建方式,可以直接在主页上点击相应的按钮新建不同模式的采集任务,也可以点击左上角图标,创建新任务。 2、删除任务 在删除单个任务时可直接点击任务右侧的“×”进行删除,如果要删除多个任务,可以按Ctrl或Shift键选中多个任务后,右击进行删除。 3、任务设置 右击任务,在弹出的菜单中对其进行设置。具体设置包括:启动任务、编辑任务、查看数据、修改名称、导出规则、修改分组和删除任务。 4、创建任务分组 点击左上角图标,创建任务分组,同时…

2023年9月5日 0条评论 44点热度 0人点赞 365crawadmin 阅读全文