l1019245175 2019-09-06 13:58 采纳率: 100%
浏览 393
已采纳

python的'\uxxxx'类型的字符串怎么样才能提取到'\u'后面的xxxx呢?

我写了一个爬虫,爬到了网页里面的一个加密数字,是'\uxxxx'这种形式的,我需要把'\u'后面的xxxx提取出来。

但是我尝试了好多种办法,分割不了,替换不了,遍历也不行。

  • 写回答

2条回答 默认 最新

  • S_o_l_o_n 2019-09-06 14:46
    关注

    假设对象s是这样一个unicode对象,可以尝试如下代码:

    parsed_code = []
    for x in s:
        parsed_code.append(hex(ord(x))[2:])
    
    

    思路就是先获取unicode字符串的unicode值,再转为十六进制,然后剔除0x标志以提取需要的信息。

    本回答被题主选为最佳回答 , 对您是否有帮助呢?
    评论
查看更多回答(1条)

报告相同问题?

悬赏问题

  • ¥60 版本过低apk如何修改可以兼容新的安卓系统
  • ¥25 由IPR导致的DRIVER_POWER_STATE_FAILURE蓝屏
  • ¥50 有数据,怎么建立模型求影响全要素生产率的因素
  • ¥50 有数据,怎么用matlab求全要素生产率
  • ¥15 TI的insta-spin例程
  • ¥15 完成下列问题完成下列问题
  • ¥15 C#算法问题, 不知道怎么处理这个数据的转换
  • ¥15 YoloV5 第三方库的版本对照问题
  • ¥15 请完成下列相关问题!
  • ¥15 drone 推送镜像时候 purge: true 推送完毕后没有删除对应的镜像,手动拷贝到服务器执行结果正确在样才能让指令自动执行成功删除对应镜像,如何解决?