【流程图模式】如何设置采集范围

2023年9月5日 33点热度 0人点赞 0条评论

不同于智能模式可以直接设置采集范围,流程图模式采集范围的设置比较复杂一些。

1、只设置结束页面,不设置开始页面的采集范围设置

这种设置比较简单,不管是有分页按钮的网页、瀑布流加载的网页还是瀑布流+分页加载的网页,都只需要选中翻页循环设置,然后在翻页次数那里设置自定义次数,用户想要在哪个页数停止,就选择填相应的页数。

1)分页按钮

2)瀑布流分页

3)瀑布流+分页按钮

2、设置开始采集页面,不设置结束页面的采集范围设置

1)网址会随着页码的变动而变动的网站

用户可以直接复制新的开始采集的网址,在页面上修改网址。

2)网址不会随着页码的变动而变动的网站

针对这种网站,我们点击页面上的分页按钮,在操作提示框内选择点击“循环点击该元素”按钮,此时软件上会设置一个新的翻页循环按钮。

假设之前的任务在第3页停止,用户要从第4页开始采集,则可以在这个翻页循环上设置自定义翻页次数“4”。

3)网址不会随着页码的变动而变动,但是页码可以通过输入的方式直接跳转的网站

有一些网站的网址虽然不会随着页码的变动而变动,但是页码部分有输入框,可以直接输入页数跳转到相应的页码,如以下这种网站:

针对这种网站,我们点击页面上的输入框,在跳转出的操作提示框内输入想要跳转的界面,此处用第4页来举例,在输入框内填入数字“4”之后,点击确定,软件上会出现一个输入文字组件。

我们再点击页面上“go”按钮,在跳转出来的提示操作框上选择“点击一次该元素”按钮,页面就会跳转到第4页去了。

3、设置开始采集页面及结束页面的采集范围设置

这种采集范围的设置,就是结合以上方法1和方法2的设置,这里不多做赘述。

365crawadmin

这个人很懒,什么都没留下

文章评论

您需要 登录 之后才可以评论