采集场景
采集采集游天下不同城市的租房信息。
采集字段
城市、标题、出租人、地址、价格、标题链接、坐标等。
点击图片可查看高清大图,下文其他图片同理
采集结果
采集结果可导出为Excel,CSV,HTML,数据库等多种格式。导出为Excel示例:
教程说明
本篇制作时间:2022/06/20 八爪鱼版本:V8.5.2
目标数据,请联系官方客服,我们将及时修正。
采集步骤
步骤一、打开网页
步骤二、提取数据
步骤三、创建【循环列表】
步骤四、提取数据
步骤五、启动采集
以下为具体步骤:
步骤一、打开网页
首页左上角点击【新建】—【自定义任务】。网址输入界面默认的是【手动输入】。
将复制好的一批同类网址,粘贴进网址输入框中,并点击【保存网址】。
如:https://www.youtx.com/kunming/in20220620-out20220624/
https://www.youtx.com/qinhuangdao/in20220620-out20220624/
八爪鱼中内置的浏览器会自动打开网页。同时,可以看到,流程中已自动创建【循环-打开网页】步骤。
特别说明:
a. 打开网页后,如果开始开始【自动识别】,请等待自动识别完成。八爪鱼支持自动识别网页上的列表,滚动和翻页,识别成功后直接启动采集并获取数据。如果【自动识别】的结果不是我们需要的,可点击【取消】关闭智能识别,自行配置采集流程。详情点击查看【自动识别】
b. 手动输入的url数量不得大于1万个,如有超过1万url,请选择【从文件导入】,具体请查看教程 网址输入升级
文章评论