Python爬取电影磁力下载链接,被识别为机器人+验证登录 如何破?

1、RT:向BT搜索网站发送Request请求,已Random Requests Header处理,发送超过120次查询,即sleep2700s,仍被识别为机器人。

2、求教:这种情况下,被识别出来的原理是因为同一IP在单位时间内发送请求数过多吗?怎么破解?

ip代理?验证码识别?

谢谢~

2个回答

1、使用ip proxy
2、增加每次爬取的时间间隔

1、BT数据源有很多,可通过多数据源累积数据
2、IP是否被目标站点封禁,手动用浏览器执行一次正常请求即可,如果手动也不能访问或者提示验证码,那就是IP被封了,如果手动能访问,程序不能,那就是程序问题(BT网站一般不长时间封禁IP)
3、如果IP被封禁,可考虑使用代理IP,至于验证码识别,有能力就识别,没能力就直接用新的代理IP即可,至于代理IP,可使用免费的,但是麻烦,可用率低,且不保证高匿,付费的代理,主要看价格能够接受,另外网上各种全国混播的adsl服务器,那个才是稳定高匿代理,IP被封禁的话,直接拨号就行了

Csdn user default icon
上传中...
上传图片
插入图片
抄袭、复制答案,以达到刷声望分或其他目的的行为,在CSDN问答是严格禁止的,一经发现立刻封号。是时候展现真正的技术了!
立即提问