notforgetwyn 2022-08-09 00:21 采纳率: 33.3%
浏览 52

Python爬虫失败,求大佬救救

img

  • 写回答

2条回答 默认 最新

  • 坚持不懈的大白 前端领域优质创作者 2022-08-09 07:48
    关注

    你这个报错403,是服务器禁止访问的意思,其实就是服务器知道你这个是爬虫,所以会禁止访问。
    你可以添加一个请求头,去模拟浏览器访问,如下:

    img


    参考代码在这:

    from urllib import request
    
    
    url = 'https://www.bilibili.com/'
    headers = {
        'user-agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/70.0.3538.25 Safari/537.36 Core/1.70.3877.400 QQBrowser/10.8.4507.400'
    }
    
    req = request.Request(url=url,headers=headers)
    rsp = request.urlopen(req)
    print(rsp.read().decode('utf-8'))
    
    
    评论 编辑记录

报告相同问题?

问题事件

  • 创建了问题 8月9日

悬赏问题

  • ¥20 C# NetworkStream WriteAsync方法卡住无反应
  • ¥15 这个如何解决详细步骤
  • ¥15 在微信h5支付申请中,别人给钱就能用我的软件,这个的所属行业是啥?
  • ¥30 靶向捕获探针设计软件包
  • ¥15 react-diff-viewer组件,如何解决数据量过大卡顿问题
  • ¥20 遥感植被物候指数空间分布图制作
  • ¥15 安装了xlrd库但是import不了…
  • ¥20 Github上传代码没有contribution和activity记录
  • ¥20 SNETCracker
  • ¥15 数学建模大赛交通流量控制