xxkkbbkk 2022-12-20 23:10 采纳率: 100%
浏览 8
已结题

python 用正则表达式提取

请问怎么用正则表达式提取
“< a h r e f = “ # ” >”中#所代表的内容呢?

img


谢谢!

  • 写回答

1条回答 默认 最新

  • ShowMeAI 2022-12-20 23:54
    关注

    单个匹配可以用下列代码

    import re
    
    html = '<a href="#">'
    pattern = r'href="(.*?)"'
    match = re.search(pattern, html)
    
    if match:
        value = match.group(1)
        print(value)  # Output: #
    

    全部匹配出来可以用下列代码

    import re
    
    html = '<a href="#">'
    pattern = r'href="(.*?)"'
    matches = re.findall(pattern, html)
    
    for match in matches:
        print(match)
    
    本回答被题主选为最佳回答 , 对您是否有帮助呢?
    评论

报告相同问题?

问题事件

  • 已结题 (查看结题原因) 12月21日
  • 已采纳回答 12月21日
  • 创建了问题 12月20日

悬赏问题

  • ¥15 poi合并多个word成一个新word,原word中横版没了.
  • ¥15 【火车头采集器】搜狐娱乐这种列表页网址,怎么采集?
  • ¥15 求MCSCANX 帮助
  • ¥15 机器学习训练相关模型
  • ¥15 Todesk 远程写代码 anaconda jupyter python3
  • ¥15 我的R语言提示去除连锁不平衡时clump_data报错,图片以下所示,卡了好几天了,苦恼不知道如何解决,有人帮我看看怎么解决吗?
  • ¥20 关于URL获取的参数,无法执行二选一查询
  • ¥15 液位控制,当液位超过高限时常开触点59闭合,直到液位低于低限时,断开
  • ¥15 marlin编译错误,如何解决?
  • ¥15 VUE项目怎么运行,系统打不开