Lazulitecn 2021-03-21 21:13 采纳率: 84.8%
浏览 180
已结题

Python re.findall怎么将字符串匹配里的某些词模糊掉后匹配

<td class="abcde:0:no_22" style=";"><center>需要提取的内容1</center>

<td class="abcde:1:no_22" style="white;"><center>需要提取的内容2</center>

<td class="abcde:2:no_22" style="blue;"><center>需要提取的内容3</center>

其中abcd:后面的是序号,no_22是必须保留的特征字符,不能直接用center,有一百多个center,序号倒是通过跳过不匹配了,但是style参数也是不定的。

#这是目前使用条件,在运行过程中报错,发现style导致报错
res = re.findall(r':no_22" style="white;"><center>(.*?)</center>',txt)

请问以上怎么提取出所有“需提取的内容X”

  • 写回答

2条回答 默认 最新

  • 「已注销」 2021-03-21 21:31
    关注
    import re
    data = """
    <td class="abcde:0:no_22" style=";"><center>需要提取的内容1</center>
    <td class="abcde:1:no_22" style="white;"><center>需要提取的内容2</center>
    <td class="abcde:2:no_22" style="blue;"><center>需要提取的内容3</center>"""
    print(re.findall("""no_22" style="white;"><center>(.*?)</center>""",data,re.M))
    print(re.findall("""no_22" style=".*?;"><center>(.*?)</center>""",data,re.M))
    本回答被题主选为最佳回答 , 对您是否有帮助呢?
    评论
查看更多回答(1条)

报告相同问题?

问题事件

  • 已结题 (查看结题原因) 8月6日

悬赏问题

  • ¥15 内存地址视频流转RTMP
  • ¥100 有偿,谁有移远的EC200S固件和最新的Qflsh工具。
  • ¥15 找一个QT页面+目标识别(行人检测)的开源项目
  • ¥15 有没有整苹果智能分拣线上图像数据
  • ¥20 有没有人会这个东西的
  • ¥15 cfx考虑调整“enforce system memory limit”参数的设置
  • ¥30 航迹分离,航迹增强,误差分析
  • ¥15 Chrome Manifest扩展引用Ajax-hook库拦截请求失败
  • ¥15 用Ros中的Topic通讯方式控制小乌龟的速度,走矩形;编写订阅器代码
  • ¥15 LLM accuracy检测