关联区域功能,可以先截取网页中指定区域内容,然后将该区域作为数据来源再进行采集处理。
关联区域功能有利于网页结构重复或者复杂的网页形式的分析以及采集。
下面介绍下关联区域功能的用法:
以网址:http://www.locoy.com/download,为例,比如只想要采集2020年间的下载链接。如果直接循环采集,那么就会采集到其他年份的链接,干扰结果,所以我们可以使用关联区域指定采集的区域。
下面介绍下具体的设置方法:
(1)添加关联区域
(2)数据来源中选择关联区域,然后按照一般的方式进行采集即可
采集结果为下图,可以看到,只在关联区域中进行了采集。
上述为其中一个示例,还有其他适用的场景,在实际使用中灵活运用。
文章评论