Sinestro 2022-04-29 12:38 采纳率: 87.5%
浏览 268
已结题

请问Python正则表达式如何匹配连续的四位数字

问题遇到的现象和发生背景

在用python处理excel时,想用正则表达式区分时间和价钱,字符串有如下几种类型:15.70元 2013-8 2017 228.00 1987.3 如下几种类型
我现在想要用正则表达式筛选出2013-8、2017、1987.3这个样子的数据,将其放到字典{‘出版时间’:''}字段,其余数字放入价钱字段

问题相关代码,请勿粘贴截图
elif dataIndex == 0:
         i.find('.')
         i.find('元')
         i.find('HKD')
         i.find('-')
         dict_Two["出版社"] = dataStringOne
         if i.find('.') != -1:
            dict_Two["价格"] = dataStringTwo
         elif i.find('元') != -1:
            dict_Two["价格"] = dataStringTwo
         elif i.find('HKD') != -1:
            dict_Two["价格"] = dataStringTwo
         elif i.find('-') != -1:
            dict_Two["出版时间"] = dataStringTwo
         else:
            dict_Two["出版时间"] = dataStringTwo

运行结果及报错内容

img

我的解答思路和尝试过的方法
我想要达到的结果

希望将2013-8、2017、1987.3这类型的数据筛选出来

  • 写回答

5条回答 默认 最新

  • CSDN专家-HGJ 2022-04-29 14:44
    关注

    题中年份后面表示日月最多6个字符,试试如下代码:

    import re
    s=['新书/20200412/价格22.6元','旧书1/2010.3/价格10.5元','旧书2/2008-3-5/价格8.8元','新书1/2021-05-06/价格30元','新书2/2022/价格50元','中华书局《月读》编辑部 编著']
    res=[]
    for x in s:
        try:
            res.append(re.findall('\/(\d{4}[-.\d+]{0,6})\/', x)[0])
        except:
            res.append('')
    print(res)
    
    F:\2022\py01>t11
    ['20200412', '2010.3', '2008-3-5', '2021-05-06', '2022', '']
    
    本回答被题主选为最佳回答 , 对您是否有帮助呢?
    评论 编辑记录
查看更多回答(4条)

报告相同问题?

问题事件

  • 系统已结题 5月14日
  • 已采纳回答 5月6日
  • 创建了问题 4月29日

悬赏问题

  • ¥15 前置放大电路与功率放大电路相连放大倍数出现问题
  • ¥30 关于<main>标签页面跳转的问题
  • ¥80 部署运行web自动化项目
  • ¥15 腾讯云如何建立同一个项目中物模型之间的联系
  • ¥30 VMware 云桌面水印如何添加
  • ¥15 用ns3仿真出5G核心网网元
  • ¥15 matlab答疑 关于海上风电的爬坡事件检测
  • ¥88 python部署量化回测异常问题
  • ¥30 酬劳2w元求合作写文章
  • ¥15 在现有系统基础上增加功能