weixin_42559167
幻非
采纳率100%
2019-02-11 18:36

python正则提取百度识别文字返回的代码

已采纳

{'log_id': 72420006072542424, 'words_result_num': 1, 'words_result': [{'words': '②标题描述要清晰明了'}]}

我想用正则把 ②标题描述要清晰明了 提取出来,各位有什么办法,谢谢了

  • 点赞
  • 写回答
  • 关注问题
  • 收藏
  • 复制链接分享
  • 邀请回答

2条回答

  • JohnTLHouse JohnTLHouse 2年前

    使用的是Python,核心方法是re.search()

    # 元数据是JSON格式的,如果没理解错的话如下
    s = "你上面的JSON数据"
    # result -> '②标题描述要清晰明了'
    result = re.search(r'[\u4e00-\u9fa5②]+', s).group()
    
    点赞 评论 复制链接分享
  • LXZ_heng LXZ_heng 2年前

    都是键值的形式,words应该不会重复,可以先提取 'words': '②标题描述要清晰明了' 整体,再把想要的部分切出来。
    仅供参考。。
    import re
    src = "{'log_id': 72420006072542424, 'words_result_num': 1, 'words_result': [{'words': '②标题描述要清晰明了'}]}"
    words = re.compile(r'\'words\': \'.*\'')
    result = re.search(words, src).group()
    print(result[10: -1])

    点赞 评论 复制链接分享

相关推荐