介绍了XPath解析的使用方法,多用户帐号采集的Cookie设置,以及如何下载图片等。  

2023年9月5日 0条评论 24点热度 0人点赞 365crawadmin 阅读全文

采集场景 在天眼查搜索页面(https://www.tianyancha.com/search),选择条件查询,得到条件查询后的结果列表页。实例网址:https://www.tianyancha.com/search?base=bj&companyType=normal_company,是选择了2个查询条件(省份地区:北京市;机构类型:企业)后得到的列表页。然后点击企业链接进入详情页,采集企业详情页的数据。     鼠标放到图片上,右键,选择【在新标签页中打开图片】可查看高清大图 下文其他图片同理   采集…

2023年9月5日 0条评论 77点热度 0人点赞 365crawadmin 阅读全文

采集场景 在58同城地区首页(https://sz.58.com/ ,示例中默认为深圳) ,进入招聘频道,输入职位名称搜索,得到搜索结果列表。点击职位标题链接进入详情页,采集该职位具体信息。   采集字段 职位、薪酬、更新时间、浏览人数、申请人数等字段。     采集结果 采集结果可导出为Excel、CSV、HTML、数据库等多种格式。导出为Excel示例:     采集步骤 步骤一:打开网页 步骤二、输入关键词并搜索 步骤三、建立【循环-点击元素】,进入每个职位的详情页 步骤四、提取职位详情页中的字段 步骤五、编…

2023年9月5日 0条评论 21点热度 0人点赞 365crawadmin 阅读全文