我想要提取对应的数字,但是只能提出来文字,应该显示数字的地方变成了[ ],然后它也没报错,实在不知道是哪里错了
关注
码龄 粉丝数 原力等级 --
- 被采纳
- 被点赞
- 采纳率
已结题
Python正则表达式无法提取数字,只能提取文字
收起
- 写回答
- 好问题 0 提建议
- 关注问题
- 微信扫一扫点击复制链接分享
- 邀请回答
- 编辑 收藏 删除
- 收藏 举报
2条回答 默认 最新
- 关注
码龄 粉丝数 原力等级 --
- 被采纳
- 被点赞
- 采纳率
CSDN专家-showbo 2022-02-28 13:12关注rightlist内容中的括号是英文状态下的,题主正则用的中文状态下的当然无法匹配,而且应该使用非贪婪匹配
import re s='''<center>[<font color="#0000FF"><b> 小麦 </b></font>]的营养素含量(指100克可食部食品中的含量) [进入食品百科查看--<a href='http://www.foodbk.com/wiki/%E5%B0%8F%E9%BA%A6' target='_blank'><font color="#0000FF"><b> 小麦 </b></font></a>的信息]</center> <div class="list"><div class="list_m">热量(千卡)</div>317</div><div class="list"><div class="list_m">硫胺素(毫克)</div>0.4</div><div class="list"><div class="list_m">钙(毫克)</div>34</div> <div class="list"><div class="list_m">蛋白质(克)</div>11.9</div><div class="list"><div class="list_m">核黄素(毫克)</div>0.1</div><div class="list"><div class="list_m">镁(毫克)</div>4</div> <div class="list"><div class="list_m">脂肪(克)</div>1.3</div><div class="list"><div class="list_m">烟酸(毫克)</div>4</div><div class="list"><div class="list_m">铁(毫克)</div>5.1</div> <div class="list"><div class="list_m">碳水化合物(克)</div>64.4</div><div class="list"><div class="list_m">维生素C(毫克)</div>0</div><div class="list"><div class="list_m">锰(毫克)</div>3.1</div> <div class="list"><div class="list_m">膳食纤维(克)</div>10.8</div><div class="list"><div class="list_m">维生素E(毫克)</div>1.82</div><div class="list"><div class="list_m">锌(毫克)</div>2.33</div> <div class="list"><div class="list_m">维生素A(微克)</div>0</div><div class="list"><div class="list_m">胆固醇(毫克)</div>0</div><div class="list"><div class="list_m">铜(毫克)</div>0.43</div> <div class="list"><div class="list_m">胡罗卜素(微克)</div>1.6</div><div class="list"><div class="list_m">钾(毫克)</div>289</div><div class="list"><div class="list_m">磷(毫克)</div>325</div> <div class="list"><div class="list_m">视黄醇当量(微克)</div>10</div><div class="list"><div class="list_m">钠(毫克)</div>6.8</div><div class="list"><div class="list_m">硒(微克)</div>4.05</div>''' findDn=re.compile(r'<div class="list_m">蛋白质\(克\)</div>(.*?)</div>') print(re.findall(findDn,s))
本回答被题主选为最佳回答 , 对您是否有帮助呢? 本回答被专家选为最佳回答 , 对您是否有帮助呢? 本回答被题主和专家选为最佳回答 , 对您是否有帮助呢?解决 1无用举报微信扫一扫点击复制链接分享编辑预览轻敲空格完成输入- 显示为
- 卡片
- 标题
- 链接
评论按下Enter换行,Ctrl+Enter发表内容
编辑
预览
轻敲空格完成输入
- 显示为
- 卡片
- 标题
- 链接
报告相同问题?
提交
- 2022-04-29 04:38回答 5 已采纳 题中年份后面表示日月最多6个字符,试试如下代码: import re s=['新书/20200412/价格22.6元','旧书1/2010.3/价格10.5元','旧书2/2008-3-5/价格8.8
- 2022-04-30 09:02回答 1 已采纳 text = '张三 张四 王小玲 13256488123 4819599 zhangtom@126.com 676197687211@qq.com 1999-03-26 《凡人修仙传》《水浒传》'r
- 2021-12-07 00:48回答 1 已采纳 原网页完全可以使用xlml之类的把字符串的源码转换为Element对象,然后用xpath之类的去解析,大概的代码应该是: _ = etree.HTML(text) data_list = _.xpat
- 2021-10-01 12:05Ly4j的博客 正则表达式是对字符串提取的一套规则,我们把这个规则用正则里面的特定语法表达出来,去匹配满足这个规则的字符串。正则表达式具有通用型,不仅python里面可以用,其他的语言也一样适用。python中re模块提供了正则...
- 2019-10-18 00:20回答 3 已采纳 爬虫内容解析比较方便的不是正则而是 xpath ,语法也很容易,建议试试这种: ``` from lxml import etree # 解析页面的模块 html = etree.HTML
- 2023-03-26 12:43回答 2 已采纳 使用右断言,可以使使一个字符参与多次匹配 例如: import re a = 'aaubb axb acb' b = re.finditer('(?=(a.*?b))', a) for m in
- 2021-04-12 08:21回答 2 已采纳 import csv import re with open("1.txt","r",encoding="utf-8") as fileObj: data = fileObj.read()
- 2020-10-19 07:34Python正则表达式是处理字符串的强大工具,它允许用户定义规则来匹配特定的字符序列。在Python中使用正则表达式时,分组是一个不可或缺的功能,它使得我们能够从复杂的字符串中提取出有用的信息。 首先,正则表达式...
- 2022-03-30 16:35回答 2 已采纳 数字用\d即可
- 2022-02-12 10:04回答 1 已采纳 题主朋友,我把两种方法都列举了,请参考 import re # 不用re的方法 def func(goal_list, set_names): string = str(goal_list
- 2022-01-19 08:23回答 2 已采纳 这应该就是你想要的功能: import os, re def GetMiddleStr(content,startStr,endStr): '''提取字符串content当中,startStr
- 2020-10-16 06:32本文着重讲解了如何使用Python正则表达式从字符串中提取数字,包括整数、小数等不同形式的数字,并提供了详细的思路分析和实例代码。 首先,我们来理解正则表达式中的基本概念和元素: - ^:表示匹配字符串的开始...
- 2024-06-25 10:03weixin_44245323的博客 提取公式:a = re.findall(“开始字符串.*末字符串”,str)
- 2021-01-19 21:13python 根据正则表达式提取指定的内容 正则表达式是极其强大的,利用正则表达式来提取想要的内容是很方便的事。 下面演示了在python里,通过正则表达式来提取符合要求的内容。 实例代码: import re # 正则...
- 2020-12-02 16:23weixin_39955355的博客 在 Python中,使用Python的内置re模块处理正则表达式操作 。在本节中,我将介绍创建正则表达式并使用它们的基础知识。您可以使用以下步骤实现正则表达式:指定模式字符串。将模式字符串编译为正则表达式对象。使用...
- 没有解决我的问题, 去提问
问题事件
悬赏问题
- ¥15 PADS Logic 原理图
- ¥15 PADS Logic 图标
- ¥15 电脑和power bi环境都是英文如何将日期层次结构转换成英文
- ¥20 气象站点数据求取中~
- ¥15 如何获取APP内弹出的网址链接
- ¥15 wifi 图标不见了 不知道怎么办 上不了网 变成小地球了
联系我们(工作时间:8:30-22:00)
400-660-0108kefu@csdn.net在线客服
- 京ICP备19004658号
- 经营性网站备案信息
- 公安备案号11010502030143
- 营业执照
- 北京互联网违法和不良信息举报中心
- 家长监护
- 中国互联网举报中心
- 网络110报警服务
- Chrome商店下载
- 账号管理规范
- 版权与免责声明
- 版权申诉
- 出版物许可证
- ©1999-2025北京创新乐知网络技术有限公司