Python中的解码问题


#encoding='gbk'
import requests
import re

url='https://mp.weixin.qq.com/s/1hdWEusrm0MJZexxC_OSaw'
head={"User-Agent": "Mozilla/5.0 "}

def get_text(response):
    # 优先使用 chardet 预测的 encoding, 其次使用 http header 提供的 encoding
    source_encoding = response.apparent_encoding or response.encoding
    if source_encoding is None:
        # 说明是二进制文件
        raise Exception
    elif source_encoding == 'GB2312':
        source_encoding = 'GBK'
    return response.content.decode(source_encoding, errors="ignore")

response=requests.get(url,headers=head)
html=get_text(response)
with open('E:/Python文件/爬虫/高一新教材/html.txt','w',encoding='GBK') as f:
    f.write(html)

pattern = re.compile(r'data-src="(.*)"', flags=re.S)
image_url=pattern.findall(str(response.content.decode('gbk')))
print(str(image_url))

上面是我的代码，应该有很多的错误，还请指出
这是我要爬的网址：https://mp.weixin.qq.com/s/1hdWEusrm0MJZexxC_OSaw
如果有更好的方案，还请给出

写回答
好问题 0 提建议
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

1条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
全栈极简领域专家: 后端开发技术领域 2021-07-18 15:59
关注
用utf8替换gbk

本回答被题主选为最佳回答 , 对您是否有帮助呢?

解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

python实现实时二维码解码、识别、验证
2022-03-02 20:43

python实现实时二维码解码、识别、验证
一文学习python中编码和解码
2024-02-18 10:29

科雷learning的博客以0x或者0X开头，比如0xa，换算为十进制表示数字10 python中可通过bin(),oct(),hex()函数依次将十进制数转换为2进制,8进制,16进制。 #定义数字10 dig1 = 10 #转为2进制 bin_dig1 = bin(dig1) print(f'十进制数字10...
python 中文编码解码
2022-04-20 18:11

deserve1218的博客 importurllib a='中文' b=urllib.parse.quote(a.encode('utf-8'))
Python二维码生成解码
2021-04-12 00:41

Python制作二维码，需要安装依赖库都是pip，可以简单的生成解码+带有中间logo的生成
URL编码解码器-Python
2021-08-22 19:22

URL编码解码器-Python
【Python】中文编解码操作
2022-07-10 14:03

魔都吴所谓的博客在做一些爬虫的时候会涉及到中文的参数get方式传递，我们给的参数是汉字，但是在实际传值过程中发现传输的并不是最初给的信息，而是一串形如：`%E4%B8%AD%E5%9B%BD`，通过肉眼是无法看到这串火星文的含义的，这串...
Python编程课程 OpenCv图像编解码
2024-08-21 09:11

Python编程课程 OpenCv图像编解码
基于python的GNSS rtcm解码算法源码
2017-10-18 10:53

在Python中，这个项目可能涉及到以下几个关键知识点： 1. **Python基础**：理解并使用Python的基本语法、数据结构（如列表、字典）、控制流（循环、条件语句）等。 2. **网络通信**：由于RTCM数据通常是通过网络...
morse.py:基于 Python 的莫尔斯解码器
2021-06-08 15:48

morse.py - 基于 Python 的 Morse 解码器 morse.m - 基于 Octave 的 Morse 生成器 generate_morse.m - 基于 Octave 的 Morse 数据集生成器 levenshtein.py - 计算两个文本文件的 Levenshtein 距离这是一组用于生成...
python微信dat图片解码.zip
2025-07-19 22:28

python微信dat图片解码
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
已采纳回答 7月18日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 7月18日

Python中的解码问题

1条回答 默认 最新

问题事件

1条回答默认最新