l1019245175 2019-09-06 13:58 采纳率: 100%
浏览 393
已采纳

python的'\uxxxx'类型的字符串怎么样才能提取到'\u'后面的xxxx呢?

我写了一个爬虫,爬到了网页里面的一个加密数字,是'\uxxxx'这种形式的,我需要把'\u'后面的xxxx提取出来。

但是我尝试了好多种办法,分割不了,替换不了,遍历也不行。

  • 写回答

2条回答 默认 最新

  • S_o_l_o_n 2019-09-06 14:46
    关注

    假设对象s是这样一个unicode对象,可以尝试如下代码:

    parsed_code = []
    for x in s:
        parsed_code.append(hex(ord(x))[2:])
    
    

    思路就是先获取unicode字符串的unicode值,再转为十六进制,然后剔除0x标志以提取需要的信息。

    本回答被题主选为最佳回答 , 对您是否有帮助呢?
    评论
查看更多回答(1条)

报告相同问题?

悬赏问题

  • ¥15 我想在一个软件里添加一个优惠弹窗,应该怎么写代码
  • ¥15 fluent的在模拟压强时使用希望得到一些建议
  • ¥15 STM32驱动继电器
  • ¥15 Windows server update services
  • ¥15 关于#c语言#的问题:我现在在做一个墨水屏设计,2.9英寸的小屏怎么换4.2英寸大屏
  • ¥15 模糊pid与pid仿真结果几乎一样
  • ¥15 java的GUI的运用
  • ¥15 Web.config连不上数据库
  • ¥15 我想付费需要AKM公司DSP开发资料及相关开发。
  • ¥15 怎么配置广告联盟瀑布流