notforgetwyn 2022-08-09 00:21 采纳率: 33.3%
浏览 53

Python爬虫失败,求大佬救救

img

  • 写回答

2条回答 默认 最新

  • 坚持不懈的大白 优质创作者: 前端开发技术领域 2022-08-09 07:48
    关注

    你这个报错403,是服务器禁止访问的意思,其实就是服务器知道你这个是爬虫,所以会禁止访问。
    你可以添加一个请求头,去模拟浏览器访问,如下:

    img


    参考代码在这:

    from urllib import request
    
    
    url = 'https://www.bilibili.com/'
    headers = {
        'user-agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/70.0.3538.25 Safari/537.36 Core/1.70.3877.400 QQBrowser/10.8.4507.400'
    }
    
    req = request.Request(url=url,headers=headers)
    rsp = request.urlopen(req)
    print(rsp.read().decode('utf-8'))
    
    
    评论 编辑记录

报告相同问题?

问题事件

  • 创建了问题 8月9日