BurningSilence 2020-11-23 16:34 采纳率: 0%
浏览 10

用python转码时,一个汉字占两个unicode时,转码报错

把下面的unicode编码转换成汉字

unicode: 

\\u5c0f\\ud84c\\uddc9\\u809d\\u4e32\\u4e32\\u9999

正确的汉字为:小𣇉肝串串香

下面是代码:

unicode_str = "\\u5c0f\\ud84c\\uddc9\\u809d\\u4e32\\u4e32\\u9999"
text = unicode_str.encode('utf-8', 'ignore').decode('unicode_escape')
print(text)
  • 写回答

1条回答 默认 最新

  • CruiseCai 2023-08-09 16:26
    关注

    可以用 cp1252代码集试一下:
    output[name].to_csv(outfile, float_format = '%.5f',index = False,encoding = 'cp1252')
    cp1252 编码是 ANSI/ASCII 的子集,因此可以使用 cp1252 编码生成 ANSI/ASCII 格式的 txt 文档。

    评论

报告相同问题?

悬赏问题

  • ¥15 is not in the mmseg::model registry。报错,模型注册表找不到自定义模块。
  • ¥15 安装quartus II18.1时弹出此error,怎么解决?
  • ¥15 keil官网下载psn序列号在哪
  • ¥15 想用adb命令做一个通话软件,播放录音
  • ¥30 Pytorch深度学习服务器跑不通问题解决?
  • ¥15 部分客户订单定位有误的问题
  • ¥15 如何在maya程序中利用python编写领子和褶裥的模型的方法
  • ¥15 Bug traq 数据包 大概什么价
  • ¥15 在anaconda上pytorch和paddle paddle下载报错
  • ¥25 自动填写QQ腾讯文档收集表