l1019245175 2019-09-06 13:58 采纳率: 100%
浏览 397
已采纳

python的'\uxxxx'类型的字符串怎么样才能提取到'\u'后面的xxxx呢?

我写了一个爬虫,爬到了网页里面的一个加密数字,是'\uxxxx'这种形式的,我需要把'\u'后面的xxxx提取出来。

但是我尝试了好多种办法,分割不了,替换不了,遍历也不行。

  • 写回答

2条回答 默认 最新

  • S_o_l_o_n 2019-09-06 14:46
    关注

    假设对象s是这样一个unicode对象,可以尝试如下代码:

    parsed_code = []
    for x in s:
        parsed_code.append(hex(ord(x))[2:])
    
    

    思路就是先获取unicode字符串的unicode值,再转为十六进制,然后剔除0x标志以提取需要的信息。

    本回答被题主选为最佳回答 , 对您是否有帮助呢?
    评论
查看更多回答(1条)

报告相同问题?