软件启动报错如下图,下载下列文件解压后将LocoySpider.exe.config直接放在火车采集器的安装根目录下,然后再次启动软件 下载文件:点击下载链接
软件启动报错如下图,下载下列文件解压后将LocoySpider.exe.config直接放在火车采集器的安装根目录下,然后再次启动软件 下载文件:点击下载链接
区间变化的变化原理为:地址中的两个参数以固定的间隔进行增长,并且相邻两组值的结束值与起始值间隔为1,以这种形式变化增长的地址格式可以使用区间变化来处理。 比如以https://www.powerchina.cn/col/col7440/index.html?uid=46098&pageNum=1,网址为例,我们使用fiddler抓包网址变化如下: 第一页:https://www.powerchina.cn/module/web/jpage/dataproxy.jsp?startrecord=1…
本次教程使用模拟器示例为夜神模拟器,下面具体介绍下设置方法: (1)下载夜神模拟器,然后按照提示安装。下载地址:https://www.yeshen.com/ (2)安装fiddler,安装后,打开fiddler查看fiddler端口号: (3)快捷键win+R。然后搜索cmd,打开后,输入ipconfig,查看本机IPV4的地址: (4)在模拟器中根据端口号以及IPV4地址设置代理: 设置→点击WLAN→鼠标点击wifi位置,长按左键,会出现一个修改网络的弹窗→高级选项,代理选择手动→填入IPV4地址以及fidd…
人工智能-AI对话功能是一个语言模型,可以模拟AI对话,进行问题解答,您可以对采集的数据通过对话的形式进行伪原创、数据提取、数字计算等等等,更多应用场景等您发掘哦~ 一、界面介绍 (1) 创意性:用来调节生成文本的创造性和多样性的一个参数。它影响了生成的文本在语法和语义上的多样性程度。更高生成的文本更加多样化和创造性但相应的可能会产生不太符合逻辑或常识的文本。更低生成的文本更加稳定和一致,但可能会过于保守,导致生成的文本变得相对可预测和缺乏新意。一般场景下保持于0.7到1.0之间,当然您可以根据您的实际…
我们用http://www.ccgp-shanxi.gov.cn/view.php?app=&type=&nav=100&page=1做测试,图中的名称,地区和状态是我要的值,我只要当前列表的数据 这是需要采集的源码信息 我们把上图中的源码复制到采集器里面 把对应的值都设置好 之后我们测试看看采集结果如何 我们再来看看列表页独立标签的用法,点开网址采集右下角的高级设置会有列表页独立标签,之后我们以标题为例,采集一下当前列表页的一个标题和列表页采集的原标题对比看看有什么区别 我们可以看到这个列…
发布模块发布错误的时候可能有很多的原因。下面列举几种情况: 1.发布时提示发布成功未知,这个有几种可能情况, ①发布模块中未写成功标识码:只有写了成功标识,程序才能根据该标识判断你是上传成功了。成功标识码是从你发布后返回的源代码中获取的,也就是你在的网站手动发布一篇文章,然后看下提示成功的页面的源代码中有什么字符,以该字符作为成功标识码。一般都是成功什么什么,不过还是要根据你网站实际返回源代码来判断 ②你已经写好了成功标识码,但是还是提示发布成功未知,这个可能是因为你的网站响应较慢,发布成功的源码返回较…
目前大多数浏览器都会自带开发者工具(一般按f12即可出现),网页的cookie以及网址打开后加载的各类信息都是可以看到的。 下面以谷歌浏览器为例: 1.在谷歌浏览器里打开http://www.sd-portygzc.com/jyxx/project.html网址 这个网址点击分页时,会发现网址是不变,这个就是典型的需要抓包真实链接的post网址。 2.从右上角自定义控制里打开开发者工具或者直接按f12运行, 3.开启工具后,点击翻页后,工具里出现了个链接,这个就是网址的翻页的请求信息 4.有些网址翻页请求的信息是不…