fatesses
fatesses
采纳率98%
2019-07-16 09:49

python在正则表达式中如何提取a标签中的内容?

10
已采纳
<li data-view="5"><a href="/5.mp3" singer="陈慧琳">记事本</a></li>
需要提取出歌手名和歌名,
歌手名我通过<a href=\"/.*?.mp3\" singer=\"(.*?)\">提取了出来
但是歌名该如何去提取呢?
  • 点赞
  • 写回答
  • 关注问题
  • 收藏
  • 复制链接分享
  • 邀请回答

3条回答

  • rubikchen 502203305 2年前

    用正则,然后获取对应组。

    #encoding=utf-8
    import re
    data = '<a href="/5.mp3" singer="陈慧琳">记事本</a>'
    regex = '<a.*?singer="(.*?)">(.*?)</a>'
    print(re.match(regex,data,re.DOTALL).groups())
    
    点赞 评论 复制链接分享
  • gouchao92 超超92 2年前

    为什么要用正则呢,用beautifulsoap模块可以直接把标签读为对象操作

    点赞 评论 复制链接分享
  • Running_Zhang PJ300 2年前

    1楼正解,没毛病
    图片说明

    点赞 评论 复制链接分享

相关推荐