春风十里往事如烟 2021-08-23 23:05 采纳率: 100%
浏览 844
已结题

爬虫爬回“您操作太频繁,请稍后再访问”怎么解决

代码如下:

import urllib.request
import jsonpath
import json

url='https://www.lagou.com/lbs/getAAllCitySearchLaabels.json'
request=urllib.request.Request(url)
response=urllib.request.urlopen(request)
html=response.read()
print(html)
jsonobj=json.loads(html)
print(jsonobj,type(jsonobj))
city_list=jsonpath.jsonpath(jsonobj,'$..name')
print(city_list,type(city_list))


file= open('city.json','w')
content=json.dumps(city_list,ensure_ascii=False)
print(content)
file.write(content)
file.close()

img

img

  • 写回答

1条回答 默认 最新

  • Pliosauroidea 2021-08-23 23:07
    关注

    用代理池
    找一堆免费代理ip,高匿级别的,每次爬取的时候轮询ip池
    ps.不建议爬取频率太高,真的把目标网站爬崩了要负法律责任的
    有帮助望采纳

    本回答被题主选为最佳回答 , 对您是否有帮助呢?
    评论

报告相同问题?

问题事件

  • 系统已结题 8月31日
  • 已采纳回答 8月23日
  • 创建了问题 8月23日