在V9中内置翻译的插件,使用以下步骤: 1.下载下面这个压缩包,并解压到采集器根目录下,注意解压的过程中要关闭火车采集器 翻译插件点击下载链接 2.若您是32位系统,那么现在直接重启下火车采集器即可使用翻译插件。  若您是64位系统,那么您需要使用在火车采集器目录打开任务管理器,打开方法是:win7及以上版本支持,按住“shift”键,然后鼠标右击,在弹窗中选择“在此处打开命令窗口”。如下图所示: 并运行指令:CorFlags.exe LocoySpider.exe /32BIT+,然后重启火车采集器即可…

2023年9月4日 0条评论 58点热度 0人点赞 365crawadmin 阅读全文

采集器可以通过设置的词库,来进行中文分词,就是经常说的自动提取关键词。 1, 设置词库 如下图: 如上图 工具==》中文分词管理,来进行中文分词管理 点击上图的“分词”按钮,来使用采集器内置的词库,进行分词测试。 点击右下角的“编辑用户词库”,打开下图: “分词高级设置”:是通过你选择的词性来进行分词。 “用户使用词库”:在这里添加的词,只要在采集结果里面出现,就会被提取为关键词。 “用户禁用词库”:顾名思义,这里添加的词,在采集结果里面出现,是不会做为关键词提取出来的。 设置好了点击“保存”按钮,保存。 2, 分…

2023年9月4日 0条评论 63点热度 0人点赞 365crawadmin 阅读全文

获取当前采集页的网址,可以按下面设置, 正则提取规则为: ^(?<content>[\s\S]*?)$ 

2023年9月4日 0条评论 57点热度 0人点赞 365crawadmin 阅读全文

(1)操作类型先选择 固定数值,填写需要替换的标签名,如替换内容标签 (2)点击新建,操作类型再选择 字符串 替换,如设置将采集到的 123 替换为 456 (3)保存后,将添加的引用名给表单名赋值 如果要替换多个字符串,可以按如下设置: 第一个写固定数值,要替换的标签名第二个是字符串替换,写替换的内容第三个继续写固定数值,要替换的标签名写第二个的引用名, 这样就是从这个替换的基础上再次替换了第四个是字符串替换,写替换的内容...如果还有更多,依次类推,  第五个选固定数值,要替换的标…

2023年9月4日 0条评论 36点热度 0人点赞 365crawadmin 阅读全文

需要插入的关键词或者语句写到文本里面,并且文本编码必须是utf8,如何把文本编码设置为utf-8看下图: 选择另存为,编码选择如下图: 在编辑标签界面,数据处理然后选择高级功能再选择随机插入如下图: 插入设置选项如下图: 按照上图说明文字,做对应插入设置。

2023年9月4日 0条评论 70点热度 0人点赞 365crawadmin 阅读全文

      关联区域功能,可以先截取网页中指定区域内容,然后将该区域作为数据来源再进行采集处理。       关联区域功能有利于网页结构重复或者复杂的网页形式的分析以及采集。       下面介绍下关联区域功能的用法:         以网址:http://www.locoy.com/downloa…

2023年9月4日 0条评论 62点热度 0人点赞 365crawadmin 阅读全文

  此功能是针对用户需求为:采集内容包含某个字符即将该字段的所有内容都替换为某个固定的内容。   使用场景例如:我们从对方网站采集城市名称,然后城市名称示例:浙江省杭州市,我们需要将这个内容替换为杭州,这时就可以使用自动分类功能。  下面以百度为例介绍下用法: 如上图,我们想要将包含百度的标题 内容更替换为 常用搜索网站,则写成如下格式: 运行结果为: 如上就是自动分类的使用方法。 其中需要注意的是:1.一行一个分类,可以写多个分类。若是一个关键词符合多个分类,则优先替换上面的分类,按…

2023年9月4日 0条评论 54点热度 1人点赞 365crawadmin 阅读全文

 火车采集器可以抓取http以及https请求中的内容,因此只要手机APP是这两种请求类型,那么其中的内容理论上就是可以抓取的。下面介绍下怎么抓取手机APP的请求。下面以苹果手机中的京东APP为例: (1)查看fiddler的端口号为多少,例下图: (2)查看本地局域网的固定IP为多少,例下图: (3)在手机中设置代理服务器,将端口号以及IP写入,例下图: 如上图设置好后,就可以将fiddler保持Capturing的状态,然后操作京东的APP,就可以看到其中的请求了,如下图: 然后你就可以在采集器中做规…

2023年9月4日 0条评论 32点热度 0人点赞 365crawadmin 阅读全文

使用管理员权限启动cmd,运行命令 netsh winsock reset ,显示重置成功后,再重启下电脑。 win10 左下角徽标上右键可以直接选择命令提示符(管理员)打开

2023年9月4日 0条评论 56点热度 0人点赞 365crawadmin 阅读全文

数据提取方式支持调用其他标签值可以让采集过程更加灵活,在提取中点击标签符号即可调用其他标签的值。下面介绍下具体使用方法: 我们以网址:https://detail.tmall.com/item.htm?id=644685533017,为例,目的为提取sku对应的颜色名称,以一个颜色为示例: 目标网站获取数据部分源码: (1)先获取该颜色的sku值 (2)点击标签选择需要调用的标签即可 下面为运行结果: 注意:调用标签在前后截取以及正则提取中皆可使用,使用方法相同。

2023年9月4日 0条评论 54点热度 0人点赞 365crawadmin 阅读全文
123456