fatesses
2019-07-16 09:49
采纳率: 98%
浏览 2.7k

python在正则表达式中如何提取a标签中的内容?

<li data-view="5"><a href="/5.mp3" singer="陈慧琳">记事本</a></li>
需要提取出歌手名和歌名,
歌手名我通过<a href=\"/.*?.mp3\" singer=\"(.*?)\">提取了出来
但是歌名该如何去提取呢?
  • 点赞
  • 写回答
  • 关注问题
  • 收藏
  • 邀请回答

3条回答 默认 最新

  • 502203305 2019-07-16 09:56
    已采纳

    用正则,然后获取对应组。

    #encoding=utf-8
    import re
    data = '<a href="/5.mp3" singer="陈慧琳">记事本</a>'
    regex = '<a.*?singer="(.*?)">(.*?)</a>'
    print(re.match(regex,data,re.DOTALL).groups())
    
    点赞 1 打赏 评论
  • PJ300 2019-07-16 10:15

    1楼正解,没毛病
    图片说明

    点赞 打赏 评论
  • 超超92 2019-07-16 23:30

    为什么要用正则呢,用beautifulsoap模块可以直接把标签读为对象操作

    点赞 打赏 评论

相关推荐 更多相似问题