python中\x08转码问题

\x08是退格键，一个字符串如果有\x08，decode时会删除前一个字符，请问如何解决？

比如：

s = b'abc\x08de'

print(s.decode())

输出：abde

c被删除了。

用requests从网上抓取数据，遇到这个字符，导致html标签的>被删除，无法正常解析。如下图，这个名字里有\x08，content里的a标签有右>，text里的就没有了。请问如何解决？

图片说明

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

1条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
Zhengbaibai 2020-06-10 16:52
关注
import re s = re.compile('[\\x00-\\x08\\x0b-\\x0c\\x0e-\\x1f]').sub(' ', str)

用正则表达式过滤乱码字符。
来源：
解决 1
无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

python downloadUrl 字段是 Base64 求转码方法 python 有问必答
2022-01-03 15:37

回答 1 已采纳应该是图片格式为base64码，用如下代码转换成图片： import base64 from PIL import Image,ImageTk from io import BytesIO,Strin
python txt转码，utf-8转gkp怎么转？ list python
2022-06-16 01:39

回答 1 已采纳读txt文件出错，代表txt文件编码形式就不是utf-8编码，可以在读取txt文件时，采用gbk等编码方式读取。（想要知道你的txt文件是什么编码形式，可以在电脑上采用文本打开，选择另存为，你会在右下
关于python转码，输出结果中全是字符串 python
2017-07-06 02:42

回答 2 已采纳它已经是unicode字符串了，你可以直接print等输出 ``` In [8]: s = u'\u73b0\u4ee3\u7b11\u8bdd' In [9]: print(s)
Python 二进制转码的问题
2021-01-20 03:15

Python 语言的语法简单快捷，但是转码/编码的总让人头痛不已，特别是涉及到文件是二进制的情况下，本人在用Python读取二进制文件的时候遇到了不能转换的问题，查阅了许多网站，无论是大家建议的encode/decode，还是...
Python 控制SAP时，无法通过引用SAP 代码对浮窗进行控制 python
2019-10-12 17:22

回答 4 已采纳 https://blog.csdn.net/champaignwolf/article/details/82250620
Python 输出乱码，求解：） python sql
2015-09-11 08:05

回答 2 已采纳咳咳，搞错了，那个是数组加个[0]就好了
Python怎么将UTF-8字符串（“%u4E0A%u7F51”）还原为中文？ python
2019-09-24 16:12

回答 1 已采纳 https://blog.csdn.net/alisen39/article/details/82895306
Python转码问题的解决方法
2020-12-24 06:11

比如，若要将某个String对象s从gbk内码转换为UTF-8，可以如下操作 s.decode(‘gbk’).encode(‘utf-8′) 可是，在实际开发中，我发现，这种办法经常会出现异常： UnicodeDecodeError: ‘gbk’ codec can’t decode ...
请问python加密解密文件时无法还原文件应如何操作. python
2019-12-23 10:19

回答 1 已采纳 https://blog.csdn.net/wcg541/article/details/98784144
如何用python对这样的文本分类并给不同的skill附上一个专属label呀 python
2023-02-24 11:28

回答 5 已采纳详细聊聊，直接给你写个图形化操作界面
大佬们，网址带有中文自动转码之后出现bytes object is not callable错误 python
2017-09-05 14:37

回答 2 已采纳你断点不能下在注释行上面。地址中如果有中文，特殊字符，要htmlencode编码
mmf:Python中的视频转码ffmpeg前端
2021-06-03 16:25

MMF（Mark 的媒体框架）由一堆脚本组成，这些脚本使用 ffmpeg、mediainfo 和 neroaacEnc 为不同的目标设备转码视频。用法 mmfplay 应用程序是 mplayer 的前端，它解析输入文件并传递正确的参数以利用 VDPAU 加速。...
将utf-8编码的文档转码保存为gbk/cp936/gb2312的格式 python
2021-10-16 15:12

回答 1 已采纳 Python实现文件编码转换GB2312、GBK、UTF-8_雍正-CSDN博客_python 文件编码转换 Python实现文件编码转换
Python request中文乱码问题解决方案
2020-09-17 11:22

主要介绍了Python request中文乱码问题解决方案,文中通过示例代码介绍的非常详细，对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下
python中文转码unicode_python 中文转码
2020-12-18 10:36

weixin_39693438的博客最近在玩一些爬虫，python中文转码刚接触是一件麻烦的事(转换的原理省略)一般来说有encode('gbk'),edcode('utf8'),decode('gbk'),decode('utf8')可以解决很大一部问题但是今天遇到了'\\u6210\\u529f'这种格式，上面...
没有解决我的问题, 去提问

悬赏问题

¥20 腾讯企业邮箱邮件可以恢复么
¥15 有人知道怎么将自己的迁移策略布到edgecloudsim上使用吗？
¥15 错误 LNK2001 无法解析的外部符号
¥50 安装pyaudiokits失败
¥15 计组这些题应该咋做呀
¥60 更换迈创SOL6M4AE卡的时候，驱动要重新装才能使用，怎么解决？
¥15 让node服务器有自动加载文件的功能
¥15 jmeter脚本回放有的是对的有的是错的
¥15 r语言蛋白组学相关问题
¥15 Python时间序列如何拟合疏系数模型

python中\x08转码问题

1条回答 默认 最新

悬赏问题

1条回答默认最新