sjahnwk 2022-05-04 15:30 采纳率: 60%
浏览 69
已结题

hive sql 正则提取问题

现有字段 ‘版本号’
A037.08.151.1.12
G037.08.157
Z03.08.152.1
Q1037.08.151.1
如果要提取第一个 . 后的内容
如何使用 regexp_extract完成?
如 G037.08.157 提取08.157
Q1037.08.151.1 提取 08.151.1
谢谢

  • 写回答

5条回答 默认 最新

  • hyh123a 全栈领域新星创作者 2022-05-04 16:16
    关注

    试下这个

    import re
    
    texts = [
        "A037.08.151.1.12",
        "G037.08.157",
        "Z03.08.152.1",
        "Q1037.08.151.1"
    ]
    for text in texts:
        version = re.findall(r'[A-Z]?\d+\.(.*)', text)
        print(version[0])
    

    hive sql写法

    select regexp_extract('Q1037.08.151.1', '[A-Z]?\d+\.(.*)', 1);
    
    本回答被题主选为最佳回答 , 对您是否有帮助呢?
    评论 编辑记录
查看更多回答(4条)

报告相同问题?

问题事件

  • 系统已结题 5月18日
  • 已采纳回答 5月10日
  • 赞助了问题酬金5元 5月4日
  • 创建了问题 5月4日