智能模式是后羿采集器中最简单的模式,也是我们首推的模式,尤其适合新手用户,本教程主要给大家介绍如何创建智能模式任务。
1、创建智能模式任务的位置:
1)在采集器首页输入框:只能输入一个网址。
在此输入网址之后,软件会直接跳转到任务编辑界面,用户可在任务编辑界面继续操作。
2)在左侧工具栏新建智能模式任务
3)在首页输入框下的右侧开始采集按钮新建智能模式任务
从 2)和 3)的位置点击之后会进入智能模式任务创建的界面,用户可以在此进行更多的设置。
2、创建智能模式任务的设置
1)选择任务创建的分组
用户可以在这里选择把任务创建在哪个分组下,此外,在左侧任务栏右击任务也可以设置分组。
2)选择任务创建的名称
用户可以选择自定义输入方式,也可以按照任务分组名称+编号的方式对任务进行命名,此外,在左侧任务栏右击任务也可以对任务进行重命名。
3)选择任务创建的网址导入方式
智能模式支持手动输入多个网址、从本地文件中导入网址(支持txt、xlxs、csv)及批量生成网址。
在该窗口中输入/导入网址时,请保证格式符合如下要求:
i) 所有的网页属于同一个网站;
ii) 多个网址请用回车键分割,保证每一行只有一个网址;
iii) 所有的网页属于同一种类型,例如都是单页类型、列表类型或列表详情页类型。
注意:不同网站的网页或者同一网站的不同类型的网页请建立不同的任务。
更多详情内容,请参考以下教程:
3、创建智能模式任务后修改网址的方式
1)在智能采集任务打开的界面中:
这里可以对网址进行编辑,超过200个请直接修改本地文件。
注意:如果是从本地文件中导入的网址,这里的修改不会影响本地文件。
编辑之后的网址格式请符合上述第2-3)条中的要求。
4、输入网址的来源:
在智能模式下,后羿采集器可以进行自动翻页,所以输入的网址应该是已经完成了搜索操作,显示出最终需要被采集的内容的页面(或是多个需要被采集的连续页面中的第一个页面)。
例如:在文档中心搜索“智能模式”,打开对应的页面,复制网址。
文章评论