发布模块发布错误的时候可能有很多的原因。下面列举几种情况: 1.发布时提示发布成功未知,这个有几种可能情况, ①发布模块中未写成功标识码:只有写了成功标识,程序才能根据该标识判断你是上传成功了。成功标识码是从你发布后返回的源代码中获取的,也就是你在的网站手动发布一篇文章,然后看下提示成功的页面的源代码中有什么字符,以该字符作为成功标识码。一般都是成功什么什么,不过还是要根据你网站实际返回源代码来判断 ②你已经写好了成功标识码,但是还是提示发布成功未知,这个可能是因为你的网站响应较慢,发布成功的源码返回较…

2023年9月4日 0条评论 52点热度 0人点赞 365crawadmin 阅读全文

目前大多数浏览器都会自带开发者工具(一般按f12即可出现),网页的cookie以及网址打开后加载的各类信息都是可以看到的。 下面以谷歌浏览器为例: 1.在谷歌浏览器里打开http://www.sd-portygzc.com/jyxx/project.html网址 这个网址点击分页时,会发现网址是不变,这个就是典型的需要抓包真实链接的post网址。 2.从右上角自定义控制里打开开发者工具或者直接按f12运行, 3.开启工具后,点击翻页后,工具里出现了个链接,这个就是网址的翻页的请求信息 4.有些网址翻页请求的信息是不…

2023年9月4日 0条评论 66点热度 0人点赞 365crawadmin 阅读全文

“火车伪原创插件.dll” 文件放到Plugins目录下。 “火车伪原创插件配置工具.exe” 文件放在采集器根目录下,和LocoySpider.exe放在同一目录。 通过使用配置工具来 填写账号、密码等信息即可。   新建任务,创建"标题"和"内容"标签,   然后在其他设置中->插件->采集结果处理插件,选择"火车伪原创插件.dll"即可。 下载链接:点击打开链接 注意: (1)若是运行插件时出现如下…

2023年9月4日 0条评论 63点热度 0人点赞 365crawadmin 阅读全文

记录自增ID:同一个内容页中,多个标签设置记录自增ID,那么多个标签都是从1开始自增,再次测试运行又会重新开始从1自增,更换个内容页测试运行,也是从1开始自增. 自增ID:设置自增ID是采集器启动后运行,开始一个自增ID,从1开始自增,之后就是自增。重启采集器后,又会重新开始自增ID,从1开始自增。 举例说明:自增记录ID:缩略图和内容两个标签都有图片下载,都设置了记录自增ID. 比如内容页网址https://zhishi.fang.com/jiaju/qg_680673.html 更换一个内容页网址,记录自增ID…

2023年9月4日 0条评论 54点热度 0人点赞 365crawadmin 阅读全文

当有类似下列应用场景: 将甲同学的姓名插入useinfo表,另甲同学有多张图片,需插入pic表,并且要求两表相关联,图片是一张图片插入一行。 那这就要求,pic表可以获得useinfo表中甲同学的自增ID。这种复杂的插入过程,则需要存储过程了。 以上述情况,可使用如下存储过程 BEGINDECLARE po INT DEFAULT 0;DECLARE oid INT DEFAULT 0;DECLARE rid VARCHAR(200) DEFAULT "";  DECLARE rid_…

2023年9月4日 0条评论 65点热度 0人点赞 365crawadmin 阅读全文

将有效的User-Agent放在文本中,然后在火车采集器中调用该文本,即可实现随机调用UA的功能,达到采集时随机更换UA的目的

2023年9月4日 0条评论 66点热度 0人点赞 365crawadmin 阅读全文
123456