从网站获取的文件是br格式的,怎样对br文件进行解压呢?
我用rb模式读取文件后,用brotli进行解压,但是解压出来的是二进制和正常编码混合的格式,重新进行decode会乱码。
import brotli
with open("XXXXXX.br",'rb') as f:
data = f.read()
print(data)
content = brotli.decompress(data).decode('unicode-escape').encode('utf-8')
print(content)
出来的结果是这样的:
\x0230B\x06FFFFFFJ\x010R\x011Z\x010b\x010r\x010z\x010\xc2\x82\x01\x010\xc2\x8a\x01R\n9https://www.iqiyipic.com/common/fix/headicons/male-50.png\x12\t9901279532\n
里边会存在\x06FFFFFFJ
和\n
,同时还有正常的文本内容,如9https://www.iqiyipic.com/
等。
请教各位同学,该如何解决此问题?