JazzYu 2021-04-18 19:38 采纳率: 50%
浏览 27

正则表达式爬取文字无法显示

用BeautifulSoup库解析能够显示文字,但用正则表达式就是空白这是为什么????求解答

  • 写回答

1条回答 默认 最新

  • coagenth 2021-04-18 22:57
    关注
    s='''<div class="title">
            <h5 class="text-overflow">
                <a href="https://xyz.com/index.html" title="">text1</a>
            </h5>
        </div>
        <div class="subtitle">type </div>'''
    
    import re
    print(re.findall('<div.*?>\s+<h5.*?>\s+<a.*?>(.*?)</a>\s+</h5>\s+</div>\s+<div.*?>(.*?)</div>',s,re.M))
    ##[('text1', 'type ')]
    
    评论

报告相同问题?