采集场景 打开东方财富网【定向增发股】类目的网页:http://data.eastmoney.com/other/dxzf.html ,采集页面上显示的股票信息。 采集字段 股票简称、基金代码、发行方式、发行总数、发行价格、最新价、发行日期、增发上市日期、锁定期、股票代码详情链接、当前采集时间等字段。 点击查看高清大图,下文其他图片同理 采集结果 采集结果可导出为Excel、CSV、HTML、数据库等多种格式。导出为Excel示例: 采集步骤 步骤一、打开网页 步骤二、创建【循环-提取…
采集场景 打开东方财富网【定向增发股】类目的网页:http://data.eastmoney.com/other/dxzf.html ,采集页面上显示的股票信息。 采集字段 股票简称、基金代码、发行方式、发行总数、发行价格、最新价、发行日期、增发上市日期、锁定期、股票代码详情链接、当前采集时间等字段。 点击查看高清大图,下文其他图片同理 采集结果 采集结果可导出为Excel、CSV、HTML、数据库等多种格式。导出为Excel示例: 采集步骤 步骤一、打开网页 步骤二、创建【循环-提取…
问题: 采集文章会保存格式吗? 回答: 不会。 软件的采集是不支持格式的保存的。如果需要保存格式,请右键设置取值属性,选择提取外部HTML选项,然后在导出的时候选择导出成HTML文件。
问题: 目标网站需要翻墙才能访问怎么办? 回答: 后羿采集器内置浏览器访问网页,与使用普通浏览器访问网页是一样的。如果国外网站需要翻墙才能访问,那么就需要现在本地电脑上进行翻墙,然后再用采集器进行数据采集。软件本身是没有翻墙功能的,后羿采集器官方无法提供任何关于如何翻墙的帮助,还请理解,实在抱歉。
问题: 发布到数据库报错怎么办? 回答: 1. 连接问题总结 1)宝塔控制面板 使用此管理工具时需要注意mysql数据库访问权限设置,和远程访问端口的开放。 2) localhost、192.168.xxx.xxx 使用此类主机地址需要注意是本机需要开启MySQL服务 3)不确定报错详请 可使用navicat先确定具体报错详情 2. 字段映射问题总结 1)字段类型 仅支持数据表中字符串和整型字段的映射(如果需要映射日期字段,需要将数据表中对应字段改成字符串类型) 2)字段长度 需要注意字段长度是否可以满足本地采集的…
在智能模式中,后羿采集器会默认按照列表类型进行识别,如果您输入网页属于单页类型,此时的页面类型识别结果肯定是不正确的;或者由于网页加载速度等其他原因,即使您输入的网页是列表类型,也可能出现识别失败的情况,此时您可以手动设置页面类型。 关于单页和列表页的介绍请参考以下教程: 什么是单页类型的网页?如何采集? 什么是列表类型的网页?如何采集? 分页设置的过程如下: “页面类型”的设置菜单如下图所示。 如果是单页类型的网页,您可以直接选择“单页类型”。 如果是列表类型的网页,您可以点击“自动识别”,软件会重新尝试识别列表…