春风十里往事如烟 2021-08-23 23:05 采纳率: 100%
浏览 766
已结题

爬虫爬回“您操作太频繁,请稍后再访问”怎么解决

代码如下:

import urllib.request
import jsonpath
import json

url='https://www.lagou.com/lbs/getAAllCitySearchLaabels.json'
request=urllib.request.Request(url)
response=urllib.request.urlopen(request)
html=response.read()
print(html)
jsonobj=json.loads(html)
print(jsonobj,type(jsonobj))
city_list=jsonpath.jsonpath(jsonobj,'$..name')
print(city_list,type(city_list))


file= open('city.json','w')
content=json.dumps(city_list,ensure_ascii=False)
print(content)
file.write(content)
file.close()

img

img

  • 写回答

1条回答 默认 最新

  • Pliosauroidea 2021-08-23 23:07
    关注

    用代理池
    找一堆免费代理ip,高匿级别的,每次爬取的时候轮询ip池
    ps.不建议爬取频率太高,真的把目标网站爬崩了要负法律责任的
    有帮助望采纳

    本回答被题主选为最佳回答 , 对您是否有帮助呢?
    评论

报告相同问题?

问题事件

  • 系统已结题 8月31日
  • 已采纳回答 8月23日
  • 创建了问题 8月23日

悬赏问题

  • ¥15 c语言怎么用printf(“\b \b”)与getch()实现黑框里写入与删除?
  • ¥20 怎么用dlib库的算法识别小麦病虫害
  • ¥15 华为ensp模拟器中S5700交换机在配置过程中老是反复重启
  • ¥15 java写代码遇到问题,求帮助
  • ¥15 uniapp uview http 如何实现统一的请求异常信息提示?
  • ¥15 有了解d3和topogram.js库的吗?有偿请教
  • ¥100 任意维数的K均值聚类
  • ¥15 stamps做sbas-insar,时序沉降图怎么画
  • ¥15 买了个传感器,根据商家发的代码和步骤使用但是代码报错了不会改,有没有人可以看看
  • ¥15 关于#Java#的问题,如何解决?