使用正则表达式提取文本数据，正则表达式如何写

需要从TXT文件中提取以下三个字段信息，正则表达式应该怎么写比较好呢？
'gender': {'type': 'male', 'probability': 1}, 'emotion': {'type': 'sad', 'probability': 0.58}}]}}, '#', 'G:\Chunyu\中1.jpg'

源数据格式是这样的：
({'error_code': 0, 'error_msg': 'SUCCESS', 'log_id': 8494848494947, 'timestamp': 1635127822, 'cached': 0, 'result': {'face_num': 1, 'face_list': [{'face_token': 'f97aca8cf9d44434e3f1e0f0a4c8a871', 'location': {'left': 28.57, 'top': 52.3, 'width': 93, 'height': 91, 'rotation': -1}, 'face_probability': 1, 'angle': {'yaw': -6.63, 'pitch': 7.59, 'roll': -2.64}, 'age': 35, 'beauty': 52.53, 'gender': {'type': 'male', 'probability': 1}, 'expression': {'type': 'none', 'probability': 1}, 'face_shape': {'type': 'square', 'probability': 0.45}, 'glasses': {'type': 'common', 'probability': 1}, 'emotion': {'type': 'sad', 'probability': 0.58}}]}}, '#', 'G:\Chunyu\中1.jpg'
这样子是一条，一共有8000+条，需要提取出加粗的部分

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

2条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
qq_278339675 2021-10-25 19:31
关注
regex = r"('gender':\s*{[^}]+})|('glasses':\s*{[^}]+})|('emotion':.+.jpg')"

不清楚是否你每个文件都是类似的，如果不行，再发出一个文件，微调下就差不多了，我写了3个捕获组，可根据需要自己调整。

有帮助可以采纳下，多谢！
本回答被题主选为最佳回答 , 对您是否有帮助呢?

解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

查看更多回答(1条)

报告相同问题？

关注问题

想使用正则表达式匹配，提取文本中特定的内容。 python 正则表达式
2022-01-19 16:23

回答 2 已采纳这应该就是你想要的功能： import os, re def GetMiddleStr(content,startStr,endStr): '''提取字符串content当中，startStr
python正则表达式提取文本的一些小疑问 python 正则表达式
2023-03-26 20:43

回答 2 已采纳使用右断言，可以使使一个字符参与多次匹配例如： import re a = 'aaubb axb acb' b = re.finditer('(?=(a.*?b))', a) for m in
python使用正则表达式提取文本中的中文项 python 正则表达式
2017-03-08 03:33

回答 1 已采纳 ``` #coding:utf-8 import re a = u"EUVWAHSZJUSBHHC|水晶城街一汽福达|148路@2deb8f03,148路@2deb8f03,169路
python正则表达式提取文本_使用Python正则表达式操作文本数据的方法
2020-12-03 00:23

weixin_39955355的博客在 Python中，使用Python的内置re模块处理正则表达式操作。在本节中，我将介绍创建正则表达式并使用它们的基础知识。您可以使用以下步骤实现正则表达式：指定模式字符串。将模式字符串编译为正则表达式对象。使用...
用python正则表达式提取TXT文本的特定符号中间的字符串并保存到CSV python 有问必答
2021-04-12 16:21

回答 2 已采纳 import csv import re with open("1.txt","r",encoding="utf-8") as fileObj: data = fileObj.read()
如何用正则表达式把文本提取出来 css python 正则表达式
2019-05-08 20:58

回答 2 已采纳 `re.findall('(.*?)',searchstr,re.DOTALL)`
正则表达式抽取文本。 python
2021-09-10 10:58

回答 2 已采纳 import re a="...id=1234&" s=re.search(r'id=(.*)&',a) printf(s.group(1)) #1234
使用Python正则表达式操作文本数据的方法
2020-12-26 01:52

在 Python中，使用Python的内置re模块处理正则表达式操作。在本节中，我将介绍创建正则表达式并使用它们的基础知识。您可以使用以下步骤实现正则表达式：指定模式字符串。将模式字符串编译为正则表达式对象。 ...
如何用正则表达式提取所有符合「介于两个特定字符串a和b之间」这一条件的内容？ python 正则表达式自然语言处理
2019-02-28 16:13

回答 2 已采纳完整地返回以下两个结果： `(?<=姓名)(.*?((?<=姓名).*?)?)(?=对)/)` 第一个子匹配结果：是什么姓名张三第二个子匹配结果：张三如果要直接获取“张
Python 如何用正则表达式只保留字符串中汉字和换行符？ python
2019-09-18 10:51

回答 2 已采纳 https://blog.csdn.net/qq_39314099/article/details/88355445 https://blog.csdn.net/mp624183768/articl
关于#正则表达式#的问题，如何解决？ python 正则表达式
2022-11-24 11:53

回答 10 已采纳 import re str="df.loc[(df['age']<23)&(df['salary']>=4000)&(df['height']<160)]" res1 = re.
python正则表达式提取文本_Python正则表达式操作文本数据
2020-12-03 00:23

weixin_39775577的博客成长离不开与优秀的同伴共同交流，如果你需要好的学习环境，好的学习资源，这里欢迎每一位热爱Python的小伙伴，Python学习圈在 Python中，使用Python的内置re模块处理正则表达式操作。在本节中，我将介绍创建正则...
python 用正则表达式筛选文本信息的实例
2020-10-18 11:16

### Python 使用正则表达式筛选文本信息的知识点详解 #### 一、正则表达式的概念与应用 正则表达式是一种强大的文本处理工具，能够帮助我们完成特定模式字符串的匹配、替换以及提取等功能。在Python中，通过`re`...
Python 实战 | 使用正则表达式从文本中提取指标
2023-09-20 14:52

企研数据的博客本文的原始数据是通过爬虫获取的。在网页中，行政处罚文书数据以表格的...由于各个文书中关于处罚金额的表述不一致，因此就需要编写一个灵活的正则表达式来实现，这里先展示一下提取的结果，相关过程会在下文继续介绍。
初学python爬虫，记录一下学习过程，正则表达式提取文本
2021-01-20 03:51

紧接上一次正则表达式提取图片，这次提取文本获取的是图书的书名，没有获取详细的内容 ''' 正则表达式模块提取网页文本面向过程式编程 ''' #导入第三方库 import re import requests #请求头 headers = {'User-...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
已结题（查看结题原因） 10月26日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
已采纳回答 10月25日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
修改了问题 10月25日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 10月25日

悬赏问题

¥15 想用@vueuse 把项目动态改成深色主题，localStorge里面的vueuse-color-scheme一开始就给我改成了dark,不知道什么原因（相关搜索：背景颜色）
¥20 OPENVPN连接问题
¥15 flask实现搜索框访问数据库
¥15 mrk3399刷完安卓11后投屏调试只能显示一个设备
¥100 如何用js写一个游戏云存档
¥15 ansys fluent计算闪退
¥15 有关wireshark抓包的问题
¥15 需要写计算过程，不要写代码，求解答，数据都在图上
¥15 向数据表用newid方式插入GUID问题
¥15 multisim电路设计

使用正则表达式提取文本数据，正则表达式如何写

2条回答 默认 最新

问题事件

悬赏问题

2条回答默认最新