hjwnaruto 2022-02-16 00:15 采纳率: 50%
浏览 35
已结题

python的json.loads如何处理带HTML的字符串

问题遇到的现象和发生背景

我有一个字符串要用JSON.loads处理成JSON对象

str = '''{"level": 1, "value": ["<p align="center">aaa"b"ccc</p>"]}'''

要用json.loads处理,但是里面的value是个HTML标签,而且里面的p标签里面的内容又有英文引号,属性那也有英文引号,直接用json.loads会报错,该如何处理好

直接用json.loads会提示

Expecting ',' delimiter: line 1 column 33 (char 32)
问题相关代码,请勿粘贴截图
运行结果及报错内容
我的解答思路和尝试过的方法
我想要达到的结果
  • 写回答

3条回答 默认 最新

  • 关注

    你已经生成字符串就不好处理了
    只能用正则表达式把html代码先提取出来,再把html代码中的引号前面加个 \
    不过这样不太好精确的提取html代码部分
    最好是能在生成这个字符串时,把html代码拼接进字符串之前就把html代码中的引号前面加 \

    import re
    import json
    str = '''{"level": 1, "value": ["<p align="center">aaa"b"ccc</p>"]}'''
    str = re.sub(r'(\[")(.*?)("\])',lambda x: x.group(1)+re.sub(r'"',r'\"',x.group(2))+x.group(3),str)
    data = json.loads(str)
    print(data)
    
    

    如有帮助,请点击我的回答下方的【采纳该答案】按钮帮忙采纳下,谢谢!

    img

    本回答被题主选为最佳回答 , 对您是否有帮助呢?
    评论 编辑记录
查看更多回答(2条)

报告相同问题?

问题事件

  • 系统已结题 2月24日
  • 已采纳回答 2月16日
  • 创建了问题 2月16日

悬赏问题

  • ¥15 ansys fluent计算闪退
  • ¥15 有关wireshark抓包的问题
  • ¥15 需要写计算过程,不要写代码,求解答,数据都在图上
  • ¥15 向数据表用newid方式插入GUID问题
  • ¥15 multisim电路设计
  • ¥20 用keil,写代码解决两个问题,用库函数
  • ¥50 ID中开关量采样信号通道、以及程序流程的设计
  • ¥15 U-Mamba/nnunetv2固定随机数种子
  • ¥15 vba使用jmail发送邮件正文里面怎么加图片
  • ¥15 vb6.0如何向数据库中添加自动生成的字段数据。