Sinestro 2022-04-29 12:38 采纳率: 87.5%
浏览 275
已结题

请问Python正则表达式如何匹配连续的四位数字

问题遇到的现象和发生背景

在用python处理excel时,想用正则表达式区分时间和价钱,字符串有如下几种类型:15.70元 2013-8 2017 228.00 1987.3 如下几种类型
我现在想要用正则表达式筛选出2013-8、2017、1987.3这个样子的数据,将其放到字典{‘出版时间’:''}字段,其余数字放入价钱字段

问题相关代码,请勿粘贴截图
elif dataIndex == 0:
         i.find('.')
         i.find('元')
         i.find('HKD')
         i.find('-')
         dict_Two["出版社"] = dataStringOne
         if i.find('.') != -1:
            dict_Two["价格"] = dataStringTwo
         elif i.find('元') != -1:
            dict_Two["价格"] = dataStringTwo
         elif i.find('HKD') != -1:
            dict_Two["价格"] = dataStringTwo
         elif i.find('-') != -1:
            dict_Two["出版时间"] = dataStringTwo
         else:
            dict_Two["出版时间"] = dataStringTwo

运行结果及报错内容

img

我的解答思路和尝试过的方法
我想要达到的结果

希望将2013-8、2017、1987.3这类型的数据筛选出来

  • 写回答

5条回答 默认 最新

  • CSDN专家-HGJ 2022-04-29 14:44
    关注

    题中年份后面表示日月最多6个字符,试试如下代码:

    import re
    s=['新书/20200412/价格22.6元','旧书1/2010.3/价格10.5元','旧书2/2008-3-5/价格8.8元','新书1/2021-05-06/价格30元','新书2/2022/价格50元','中华书局《月读》编辑部 编著']
    res=[]
    for x in s:
        try:
            res.append(re.findall('\/(\d{4}[-.\d+]{0,6})\/', x)[0])
        except:
            res.append('')
    print(res)
    
    F:\2022\py01>t11
    ['20200412', '2010.3', '2008-3-5', '2021-05-06', '2022', '']
    
    本回答被题主选为最佳回答 , 对您是否有帮助呢?
    评论 编辑记录
查看更多回答(4条)

报告相同问题?

问题事件

  • 系统已结题 5月14日
  • 已采纳回答 5月6日
  • 创建了问题 4月29日

悬赏问题

  • ¥15 咨询一下有关于王者荣耀赢藏战绩
  • ¥100 求购一套带接口实现实习自动签到打卡
  • ¥50 MacOS 使用虚拟机安装k8s
  • ¥500 亚马逊 COOKIE我如何才能实现 登录一个亚马逊账户 下发新 COOKIE ..我使用下发新COOKIE 导入ADS 指纹浏览器登录,我把账户密码 修改过后,原来下发新COOKIE 不会失效的方式
  • ¥20 玩游戏gpu和cpu利用率特别低,玩游戏卡顿
  • ¥25 oracle中的正则匹配
  • ¥15 关于#vscode#的问题:把软件卸载不会再出现蓝屏
  • ¥15 vimplus出现的错误
  • ¥15 usb无线网卡转typec口
  • ¥30 怎么使用AVL fire ESE软件自带的优化模式来优化设计Soot和NOx?