1、如果您是新手,请务必先看一下官网视频讲解教程。 教程地址:http://www.houyicaiji.com/?type=videolist 视频教程是由我们官方培训讲师给大家讲解后羿采集器的使用方法,每一篇教程其实都很简短,如果大家在开始采集之前先看一下这些视频讲解教程,大部分问题都能得到解答。   2、XX 网站能不能采集?XX 数据能不能采集? 请先参考第一条。 官网视频讲解教程中我们已经介绍过,后羿采集器是一款通用网页采集软件,只要是有网址,可以通过网页浏览,您能看得见的内容,大多都是可以采集…

2023年9月5日 0条评论 40点热度 0人点赞 365crawadmin 阅读全文

新朋友,您好! 感谢您在茫茫采集软件海(这个词好像哪里不对,请不要在意这些细节)中选择我们后羿采集器。 我们后羿采集器是一款不限制导出采集结果,真正免费的网页采集工具, 关于免费这件事我们专门写了一篇文章,请移步这里 →_→ 后羿采集器是不是免费的? 后羿采集器的使用方法非常简单,我们官方也为大家提供了配套的讲解视频教程和图文教程。   视频教程是由我们的讲师为大家系统性地介绍后羿采集器的使用方法,内容包括新手入门、智能模式、流程图模式三个部分。 建议大家在使用前先看一下视频教程,链接在此:http://…

2023年9月5日 0条评论 33点热度 0人点赞 365crawadmin 阅读全文

采集任务是后羿采集器记录采集任务的具体设置信息,并且能进行导入导出操作的一个程序脚本。 导入已有的任务后既可以进行修改,也可以不做修改直接按照所配置的任务自动地进行数据采集,导出的任务可以发送给其他用户进行使用。 导入的任务可以直接右击任务,点击开始运行或者点击编辑任务对任务进行修改。 下面介绍一下如何导入和导出采集任务。 1、导入采集任务 点击左上角图标导入本地任务。 2、导出采集任务 右击任务,选择导出任务到本地。

2023年9月5日 0条评论 43点热度 0人点赞 365crawadmin 阅读全文

在后羿采集器中,采集任务的基础设置如下: 1、创建新任务 后羿采集器提供了任务的多种创建方式,可以直接在主页上点击相应的按钮新建不同模式的采集任务,也可以点击左上角图标,创建新任务。 2、删除任务 在删除单个任务时可直接点击任务右侧的“×”进行删除,如果要删除多个任务,可以按Ctrl或Shift键选中多个任务后,右击进行删除。 3、任务设置 右击任务,在弹出的菜单中对其进行设置。具体设置包括:启动任务、编辑任务、查看数据、修改名称、导出规则、修改分组和删除任务。 4、创建任务分组 点击左上角图标,创建任务分组,同时…

2023年9月5日 0条评论 45点热度 0人点赞 365crawadmin 阅读全文

以下是在使用后羿采集器过程中涉及到的一些名词。 采集规则: 这是后羿采集器记录采集任务的具体设置信息,并且能进行导入导出操作的一个程序脚本。导入已有的规则后既可以进行修改,也可以不做修改直接按照所配置的规则自动地进行数据采集,导出的规则可以发送给其他用户进行使用。   XPath: 这是一种路径查询语言,简单的说就是利用一个路径表达式找到我们需要的数据在网页中的位置。 以下简介来自百度百科,请点此查看更详细内容: XPath即为XML路径语言,它是一种用来确定XML(标准通用标记语言的子集)文档中某部分位…

2023年9月5日 0条评论 37点热度 0人点赞 365crawadmin 阅读全文

后羿采集器提供了两种不同的采集模式,针对不同的网站和采集需求,选择合适的采集模式不仅可以降低采集难度,同时也可以提高采集效率。 下面我们来看一下如何选择合适的采集模式。 1、智能模式:适合列表类型网页、单页类型网页和列表+详情页类型网页 智能模式比较适合以上三种类型的网页,复杂的网页类型不宜使用该模式,会降低采集对象的识别准确率。 在批量采集多个网址时,建议只输入同一个网站的同一种类型的网页,例如全部都是列表类型或全部都是单页类型,不同网站或不同类型的网页建议创建不同的任务进行采集。 如果您没有编程基础,或是想省去…

2023年9月5日 0条评论 42点热度 0人点赞 365crawadmin 阅读全文

这个就更厉害了! 流程图模式是后羿采集器团队为了满足用户丰富的个性化数据采集需求而研发的操作模式。 流程图模式支持可视化的网页点选操作,完全符合人工浏览网页的思维方式,用户只需要打开被采集的网站,用鼠标点击几下就能自动生成复杂的数据采集规则。   流程图模式可以采集目前互联网上99%的网页数据。流程图模式不仅支持单个网址的采集和多个网址的批量采集,支持从本地文件批量导入网址,而且还支持参数网址批量生成。  点此进一步了解流程图模式的使用方法。

2023年9月5日 0条评论 39点热度 0人点赞 365crawadmin 阅读全文

这个说起来可就厉害了! 智能模式是后羿采集器团队基于人工智能技术研发的新一代采集模式。 该模式操作极其简单,只需要输入被采集的网址就能智能识别出网页中的内容,无需配置任何采集规则就能够完成数据的采集。我们来简单看一下是怎么操作的。 智能模式支持单个网址的采集和多个网址的批量采集,支持从本地TXT文档中批量导入网址,并且支持批量生成网址。 智能模式主要针对单页类型网页、列表类型网页和列表+详情页类型的网页,在批量采集多个网址时,建议只输入同一种类型的网页,例如全部都是列表类型或全部都是内容类型。 不同类型的网页建议创…

2023年9月5日 0条评论 30点热度 0人点赞 365crawadmin 阅读全文

1、后羿采集器的下载及安装 (1)下载 后羿采集器支持Windows、Mac和Linux全操作系统。您可以点此进入官网首页直接下载软件,网站会根据你的操作系统推送相应的版本; 或者点此打开官网下载页面,这里提供了不同操作系统的安装包下载链接,您可以根据自己的操作系统需求下载对应的安装包。 (2)安装 下载完成后请在文件保存路径找到安装包文件,双击进行安装。 2、后羿采集器的注册及设置 (1)打开后羿采集器,点击左上角进行新用户注册。 (2)您可以选择手机注册或者邮箱注册,后羿采集器为神箭手旗下产品,如果您已经注册过…

2023年9月5日 0条评论 43点热度 0人点赞 365crawadmin 阅读全文

经常有用户来问我们,你们后羿采集器是不是免费的啊? 我们说那是必须的啊! 你看我们连导出数据都不限制,这是下了多大的决心啊!~~~ 然后用户就会扔给我们一张度娘的搜索结果截图, “这年头,还有哪家采集器说自己不免费啊?老实说吧,下载图片、导出数据这些需要多少积分?积分多少钱?我懂的!” 面对这种结果,我们也是很无奈的。 目前市面上几乎所有的数据采集软件都宣称自己是免费的,但是往往都会对基本功能进行限制,比如必须使用积分才能进行数据导出;或是限制授权电脑数量;或是不能下载图片;或着是对导出数据的格式进行严格的限制,免…

2023年9月5日 0条评论 54点热度 0人点赞 365crawadmin 阅读全文
1484950515279