qiandaoxc 2021-07-31 19:18 采纳率: 0%
浏览 530
已结题

'gbk' codec can't decode byte 0x8b in position 1: illegal multibyte sequence 写爬虫出现的问题怎么解决啊


def askURL(url):
    head = {    #模拟浏览器头部信息,向招聘网服务器发送消息
        "User-Agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/92.0.4515.107 Safari/537.36"
    }
    #用户代理,表示告诉招聘网服务器,我们是什么类型的机器、浏览器(本质上是告诉浏览器,我们可以接受什么水平的信息)
    request = urllib.request.Request(url=url,headers=head)
    html = ""
    try:
        response = urllib.request.urlopen(request)
        html = response.read().decode("gbk")   
    except urllib.error.URLError as e:
        if hasattr(e,"code"):
            print(e.code)
        if hasattr(e,"reason"):
            print(e.reason)
    return html

这个是函数,html = response.read().decode("gbk") 这个语句每次都报错

baseurl="https://jobs.51job.com/p"
for i in range(1,3):       #调用获取页面信息的函数两次
        url = baseurl + str(i)
        html = askURL(url)   #保存获取到的网页
  • 写回答

0条回答 默认 最新

    报告相同问题?

    问题事件

    • 系统已结题 8月8日
    • 创建了问题 7月31日

    悬赏问题

    • ¥15 opencv 无法读取视频
    • ¥15 用matlab 实现通信仿真
    • ¥15 按键修改电子时钟,C51单片机
    • ¥60 Java中实现如何实现张量类,并用于图像处理(不运用其他科学计算库和图像处理库))
    • ¥20 5037端口被adb自己占了
    • ¥15 python:excel数据写入多个对应word文档
    • ¥60 全一数分解素因子和素数循环节位数
    • ¥15 ffmpeg如何安装到虚拟环境
    • ¥188 寻找能做王者评分提取的
    • ¥15 matlab用simulink求解一个二阶微分方程,要求截图