有很多网站,是需要登录账号密码以后,才能采集到目标数据的。有的网站登录时还会需输入验证码。 针对这类网站,八爪鱼提供多种解决方法。本课将详细讲解。   方法一、浏览器模式+记住Cookie   针对需要登录的网站,我们可以先将八爪鱼切换成浏览器模式,在浏览器模式下完成登录。然后通过获取Cookie记住登录状态。这样,八爪鱼 能在执行采集任务时,直接以登录状态打开网页,然后再采集数据。   场景一:输入账号、密码登录   以豆瓣网为例, 登录网址为:https://www.douban.com 实际要采集数据的网址为…

2023年9月5日 0条评论 41点热度 0人点赞 365crawadmin 阅读全文

有时候,我们有大量同类网页,希望八爪鱼能自动采集每个网页中的数据。通过设置【URL循环】,可实现此需求。   什么是同类网页?结构相同、字段差不多的网页。例:   京东商品详情页: https://item.jd.com/1138288.html https://item.jd.com/27305099378.html https://item.jd.com/46339353993.html   豆瓣电影详情页: https://movie.douban.com/subject/26387939/ https://…

2023年9月5日 0条评论 53点热度 0人点赞 365crawadmin 阅读全文

采集场景 打开东方财富网【定向增发股】类目的网页:http://data.eastmoney.com/other/dxzf.html ,采集页面上显示的股票信息。    采集字段 股票简称、基金代码、发行方式、发行总数、发行价格、最新价、发行日期、增发上市日期、锁定期、股票代码详情链接、当前采集时间等字段。   点击查看高清大图,下文其他图片同理     采集结果 采集结果可导出为Excel、CSV、HTML、数据库等多种格式。导出为Excel示例:     采集步骤   步骤一、打开网页 步骤二、创建【循环-提取…

2023年9月5日 0条评论 25点热度 0人点赞 365crawadmin 阅读全文

在 客户端界面介绍 里,我们简单讲了数据采集的2种模式:【使用模板采集数据】和【自定义配置采集数据】。 本文将详细讲解【使用模板采集数据】,【自定义配置采集数据】可点击开始学习 。   一、使用【使用模板采集数据】 顾名思义,【采集模板】是由八爪鱼官方提供的、做好的采集模板,目前已有200+采集模板,涵盖主流网站的采集场景。模板数还在不断增加。 【使用模板采集数据】时,只需输入几个参数(网址、关键词、页数等),就能在几分钟内快速获取到目标网站数据。(类似PPT模板,只需修改关键信息就能直接使用,无需自己从头配置。)…

2023年9月5日 0条评论 41点热度 0人点赞 365crawadmin 阅读全文

后羿采集器,基于人工智能技术,无需编程,可视化操作,免费导出采集结果,只需输入网址就能自动识别采集内容的数据采集工具。 简介 WordPress是一种流行的开源内容管理系统(CMS),用于创建和管理网站。它是一个功能强大、灵活且易于使用的平台,被广泛应用于个人博客、商业网站、新闻门户、电子商务平台等各种类型的网站。

2023年9月5日 0条评论 164点热度 0人点赞 365crawadmin 阅读全文

后羿采集器,基于人工智能技术,无需编程,可视化操作,免费导出采集结果,只需输入网址就能自动识别采集内容的数据采集工具。 简介 TXT格式是一种纯文本格式,全称为”Text File”,即文本文件。它是一种非常简单的文件格式,仅包含纯文本内容,没有任何格式化、样式、图像或其他多媒体元素。

2023年9月5日 0条评论 52点热度 0人点赞 365crawadmin 阅读全文

后羿采集器,基于人工智能技术,无需编程,可视化操作,免费导出采集结果,只需输入网址就能自动识别采集内容的数据采集工具。 简介 Umbraco是一个基于ASP.NET的免费开源内容管理系统(CMS)。它提供了灵活的内容管理功能,允许用户轻松地创建和管理网站内容。Umbraco还支持自定义模板和插件,使用户可以根据自己的需求定制网站功能。其开源性质意味着开发者可以自由地修改和扩展系统,以满足特定的业务需求。

2023年9月5日 0条评论 51点热度 0人点赞 365crawadmin 阅读全文

后羿采集器,基于人工智能技术,无需编程,可视化操作,免费导出采集结果,只需输入网址就能自动识别采集内容的数据采集工具。 简介 Weebly是一个用户友好的网站建设平台,旨在帮助个人用户、创业者和小型企业轻松创建和管理自己的网站和在线商店。无需编程知识,用户可以通过拖放式界面选择模板、添加内容、调整布局和设计,快速搭建出具有专业外观的网站。

2023年9月5日 0条评论 51点热度 0人点赞 365crawadmin 阅读全文

问题: 采集文章会保存格式吗? 回答: 不会。 软件的采集是不支持格式的保存的。如果需要保存格式,请右键设置取值属性,选择提取外部HTML选项,然后在导出的时候选择导出成HTML文件。

2023年9月5日 0条评论 60点热度 0人点赞 365crawadmin 阅读全文

问题: 目标网站需要翻墙才能访问怎么办? 回答: 后羿采集器内置浏览器访问网页,与使用普通浏览器访问网页是一样的。如果国外网站需要翻墙才能访问,那么就需要现在本地电脑上进行翻墙,然后再用采集器进行数据采集。软件本身是没有翻墙功能的,后羿采集器官方无法提供任何关于如何翻墙的帮助,还请理解,实在抱歉。

2023年9月5日 0条评论 62点热度 0人点赞 365crawadmin 阅读全文
1363738394054