weixin_44769157
Lazulitecn
采纳率81.3%
2021-03-19 23:18 阅读 156

Python re.findall怎么提取两个含符号的字符段中间的内容

10

需查找的内容:

<td class="abcde:0:no_22" style="white;"><center>需要提取的内容1</center>

<td class="abcde:1:no_22" style="white;"><center>需要提取的内容2</center>

<td class="abcde:2:no_22" style="white;"><center>需要提取的内容3</center>

#使用这条匹配返回结果为空​​​​​
'''no_222" style="white;"><center>(.*)</center>'''

#使用这条匹配能正常查到匹配条件的内容
'''no_222" style="white;">'''
 
#使用这条匹配返回结果就为空了​​​​​
'''no_222" style="white;"><'''
  • 点赞
  • 写回答
  • 关注问题
  • 收藏
  • 复制链接分享

6条回答 默认 最新

  • 已采纳
    jslang 天际的海浪 2021-03-19 23:26
    import re
    
    txt ='''
    <td class="abcde:0:no_22" style="white;"><center>需要提取的内容1</center>
    <td class="abcde:1:no_22" style="white;"><center>需要提取的内容2</center>
    <td class="abcde:2:no_22" style="white;"><center>需要提取的内容3</center>
    '''
    res = re.findall(r':no_22" style="white;"><center>(.*?)</center>',txt)
    print(res)
    

    输出结果

    ['需要提取的内容1', '需要提取的内容2', '需要提取的内容3']

    点赞 1 评论 复制链接分享
  • herosunly herosunly 2021-03-19 23:25

    是要找<center>需要提取的内容1,还是需要提取的内容1?

    点赞 评论 复制链接分享
  • weixin_41908433 知雀的天空 2021-03-19 23:27
    import re
    html='''
    <td class="abcde:0:no_22" style="white;"><center>需要提取的内容1</center>
    <td class="abcde:1:no_22" style="white;"><center>需要提取的内容2</center>
    <td class="abcde:2:no_22" style="white;"><center>需要提取的内容3</center>
    '''
    result = re.findall('no_22" style="white;"><center>(.*?)</center>',html,re.S)
    print(result)
    点赞 评论 复制链接分享
  • herosunly herosunly 2021-03-19 23:28

    两个含符号的字符段也不一定是center吧?

    点赞 评论 复制链接分享
  • herosunly herosunly 2021-03-20 00:09

    既包括了中间的center,而且也提出了后面的内容的代码如下:

    import re
    
    html = '''
    <td class="abcde:0:no_22" style="white;"><center>需要提取的内容1</center>
    <td class="abcde:1:no_22" style="white;"><center>需要提取的内容2</center>
    <td class="abcde:2:no_22" style="white;"><center>需要提取的内容3</center>
    '''
    result = re.findall('td.*?<center>(.*?)</center>', html, re.M)
    print(result)
    点赞 评论 复制链接分享
  • funny123 coagenth 2021-03-20 00:09

     

    re.findall(
        r'<td class="abcde:\d+:no_22" style="white;"><center>(.*)</center>', t)
    点赞 评论 复制链接分享

相关推荐