采集器可以通过设置的词库,来进行中文分词,就是经常说的自动提取关键词。 1, 设置词库 如下图: 如上图 工具==》中文分词管理,来进行中文分词管理 点击上图的“分词”按钮,来使用采集器内置的词库,进行分词测试。 点击右下角的“编辑用户词库”,打开下图: “分词高级设置”:是通过你选择的词性来进行分词。 “用户使用词库”:在这里添加的词,只要在采集结果里面出现,就会被提取为关键词。 “用户禁用词库”:顾名思义,这里添加的词,在采集结果里面出现,是不会做为关键词提取出来的。 设置好了点击“保存”按钮,保存。 2, 分…