智能模式会自动识别网页中的列表数据,如果我们想要采集列表页对应的详情页中的数据,可以使用深入采集功能。所谓深入采集就是通过当前页面的链接进入对应详情页进行采集。
1、点击“深入采集”按钮
当列表页上只有一个链接字段时,点击任务操作栏上的“深入采集”按钮会打开链接字段中的第一个链接对应的详情页。我们可以在此页面上进行采集规则的设置,其他详情页会自动根据该页面的设置规则进行采集。
如果存在多个链接字段,点击“深入采集”按钮时会弹出提示框,我们需要选择一个链接字段进行深入采集。
此外,如果我们已经选中了某一个链接字段(点击字段名称可以选中该字段),点击“深入采集”按钮会直接对该链接字段进行深入采集。
2、直接点击链接字段中的某一条链接
使用“深入采集”按钮时,默认打开第一条链接对应的详情页,有的时候可能存在第一条数据为广告的情况,此时我们可以直接点击某一条链接进行深入采集。
点击链接字段中的任意一条链接,都可以打开对应的详情页,然后可以在该页面上进行深入采集的规则设置。其他页面会自动按照该页面设置的规则进行采集。
文章评论