2016-04-08 17:22:26 来源:互联网 次阅读
这里以百度为例,来说明下,打开花刺
点击 我们事先添加的代理地址发布网叶,这里点击 国内透明,再点击 下载代理资源,稍后就能自动抓取到地址,(设置里要选中 启用模糊匹配抓取代理)有时候可能要多试几次才能成功
再点击 设置 打开参数设置,把百度添加上,并选中,特征字符串就找的是大家最常用的,<title>......</title>里面的内容,百度的这个内容就是 百度一下,你就知道 接着 确定就行了
再点击 验证全部 ,结果却没有一个验证成功,都是超时、连接失败、不匹配,真的没有一个能成功使用的IP吗,当然不是
这其实是因为网站使用编码没有被正解解析造成的,可以这样看看,右击状态为不匹配的IP,选择 验证选定 ,结果你就会发现,汉字都是乱码,根本就没有 百度一下,你就知道 的字符串,验证当然就 不匹配了
解决的办法很简单,直接找一个英文或数字字符串,当 特征字符串 就好了,软件会在要验证的网叶找查找这个字符串,找到就验证通过了,往下看返回的百度 网叶的源码,看到了 hao123 ,如果连接不到百度网叶的话,肯定不可能返回这个,所以我们就选这个为特征字符串好了,当然还有很多种选择,也可以直接将<title>...... </title>之间的乱码设置成特征字符串。这里有一点要注意的,如果浏览器自动登录百度账号,有可能不会有这个 hao123 的字符串返回。这时要选其它的字符串了
关闭这个源码框,回到花刺主界面,点击 设置 将 百度的 特征字符串 改为 hao123,再点 确认
到主界面再点 验证全部 ,大部分不匹配的全都显示时间了,还有一两个,是真的不匹配的,到这儿就结束了。还有什么不明白的可以问我。