python正则提取百度识别文字返回的代码

{'log_id': 72420006072542424, 'words_result_num': 1, 'words_result': [{'words': '②标题描述要清晰明了'}]}

我想用正则把 ②标题描述要清晰明了 提取出来,各位有什么办法,谢谢了

2个回答

使用的是Python,核心方法是re.search()

# 元数据是JSON格式的,如果没理解错的话如下
s = "你上面的JSON数据"
# result -> '②标题描述要清晰明了'
result = re.search(r'[\u4e00-\u9fa5②]+', s).group()

都是键值的形式,words应该不会重复,可以先提取 'words': '②标题描述要清晰明了' 整体,再把想要的部分切出来。
仅供参考。。
import re
src = "{'log_id': 72420006072542424, 'words_result_num': 1, 'words_result': [{'words': '②标题描述要清晰明了'}]}"
words = re.compile(r'\'words\': \'.*\'')
result = re.search(words, src).group()
print(result[10: -1])

Csdn user default icon
上传中...
上传图片
插入图片
抄袭、复制答案,以达到刷声望分或其他目的的行为,在CSDN问答是严格禁止的,一经发现立刻封号。是时候展现真正的技术了!
立即提问
相关内容推荐