【流程图模式】流程图组件介绍

2023年9月5日 44点热度 0人点赞 0条评论

流程图任务是由各种组件构成的,每种组件对应不同的操作,下面我们针对每个组件及其对应的设置参数进行详细的介绍。

1、打开网页

打开网页组件的作用是打开网页,流程图任务创建时会自动生成一个打开网页组件,该组件作为任务的第一个组件,不能被拖动或者删除。

在右侧的组件设置窗口中,点击右侧任务网址可以进行编辑,此处的编辑和编辑流程图任务网址是相同的操作。

当打开网页组件不处于任务起始位置时,设置如下图所示,选择自定义选项可以输入自定义的网址。

2、点击

点击组件的作用是点击页面中的元素,它的设置如下图所示:

通常该组件会在点击提示后自动生成,如果需要手动点选元素,操作步骤如下:

第一步:点击右侧十字图标

第二步:在页面中点击想要点击的元素

软件会根据点击自动提取目标元素的Xpath,点击Xpath右侧的编辑按钮也可以进行再次编辑。

需要注意的是,在操作过程中,软件会自动识别当前是否需要在点击后打开新标签,如果识别结果与实际情况不一致,大家可以进行修改。

3、提取数据

提取数据组件的作用是提取数据,它的设置如下图所示:

提取数据组件的设置中心和智能模式下方基本一致,包括设置停止条件、数据筛选、清空所有字段、深入采集和添加字段。(智能模式的设置停止条件合并在设置范围中)

在同一个任务中可能会有多个提取数据组件,所有的提取数据组件的停止条件和数据筛选是共享的,最终的采集数据会由各个提取数据组件的数据,再结合流程图结构拼在一起。

4、定时等待

定时等待组件的作用是等待,它的设置如下图所示:

等待时长可以设置为一个随机范围或是一个固定数值,在设置随机范围时,填入一个范围值,数值之间用~分割。

5、滚动页面

滚动组件的作用有两个,一个是滚动到底部预加载数据,另一个是滚动到目标数据的界面,它的设置如下图所示:

(1)滚动到页面底部

(2)滚动一屏高度(一屏就是当前电脑显示屏的高度)

当选择滚动后等待时长为不限时,意味着软件会一直等到所有网络请求都完成,否则会一直停止在那里。

需要注意的是,网页内容完整显示出来并不代表网络请求已经全部完成。

6、输入文本

输入文本组件的作用是在网页的输入框中输入文本,它的设置如下图所示:

(1)文本内容:依次输入循环组件中的文本列表

(2)文本内容:输入复制组件复制的文本

(3)文本内容:输入文本

通常该组件会在点击提示后自动生成,如果需要手动点选输入框,操作步骤如下:

第一步:点击右侧十字图标

第二步:在页面中点击输入框

软件会根据点击自动提取输入框的Xpath,点击Xpath右侧的编辑按钮也可以进行再次编辑。

7、移动鼠标

移动鼠标组件的作用是针对网页中需要移动鼠标到元素上才显示内容的情况,它的设置如下图所示:

8、下拉框

下拉框组件的作用是针对网页中的下拉框选项,它的设置如下图所示:

(1)选择下拉框:循环组件中的下拉框

(2)选择下拉框:手动点选下拉框

选择循环组件中的下拉框通常用于遍历下拉框选项的场景,手动点选下拉框通常用于选择单个下拉框选项的场景。

通常该组件会在点击提示后自动生成,如果需要手动点选下拉框,操作步骤如下:

第一步:点击右侧十字图标

第二步:在页面中点击下拉框,软件会根据点击自动提取下拉框的Xpath,点击Xpath右侧的编辑按钮也可以进行再次编辑。

第三步:选择某个选项

9、判断

判断组件的作用是针对不同的条件进行判断,从而进行不同的操作,它的设置如下图所示:

(1)判断条件:包含文本

(2)判断条件:包含元素

如果需要手动点选元素,操作步骤如下:

第一步:点击右侧十字图标

第二步:在页面中点击用于判断的元素,软件会根据点击自动提取元素的Xpath,点击Xpath右侧的编辑按钮也可以进行再次编辑。

判断组件通常不会单独使用,需要结合其他组件一起使用。在判断组件中包含两个分支,可以将其他组件拖入分支中,其中“X”分支表示判断条件不满足时执行这条分支上的组件,“√”分支表示判断条件满足时执行这条分支上的组件。

10、循环

循环组件的作用是循环执行一些操作,它的设置如下图所示:

(1)循环方式:单个文本列表

(2)循环方式:组合文本列表

(3)循环方式:列表元素

(4)循环方式:下拉框

(5)循环方式:分页

分页类型有以下三种:

第一种:分页按钮

第二种:瀑布流分页(滚动加载)

第三种:滚动加载+分页按钮

手动点选分页按钮的操作和上文中的点选操作一致,翻页次数无限表示一致采集到最后一页才停止任务。

循环组件通常不会单独使用,其他组件可以拖入循环组件中,然后按照循环方式循环执行,循环组件和循环组件也可以进行嵌套,如下图所示:

11、返回

返回组件的作用是返回上一个页面,它的设置如下图所示:

12、复制

复制组件的作用是复制页面中元素的内容,它的设置如下图所示:

13、验证码

验证码组件的作用是识别验证码并实现手动输入验证码,它的设置如下图所示:

在验证码组件设置中,需要分别选择验证码输入框、验证码图片、验证码提交按钮、验证码错误提示,手动点选的操作和上文中其他组件的操作相同。验证码无法通过手动拖动组件来实现,根据软件提示在页面中点击操作即可。

14、跳出循环

跳出循环组件的作用是提前结束循环组件的操作,它的设置如下图所示:

跳出循环组件通常和判断组件结合使用,即在满足什么条件或者不满足什么条件下提前结束循环,基本的结构如下图所示:

365crawadmin

这个人很懒,什么都没留下

文章评论

您需要 登录 之后才可以评论