Sinestro 2022-04-29 12:38 采纳率: 87.5%
浏览 268
已结题

请问Python正则表达式如何匹配连续的四位数字

问题遇到的现象和发生背景

在用python处理excel时,想用正则表达式区分时间和价钱,字符串有如下几种类型:15.70元 2013-8 2017 228.00 1987.3 如下几种类型
我现在想要用正则表达式筛选出2013-8、2017、1987.3这个样子的数据,将其放到字典{‘出版时间’:''}字段,其余数字放入价钱字段

问题相关代码,请勿粘贴截图
elif dataIndex == 0:
         i.find('.')
         i.find('元')
         i.find('HKD')
         i.find('-')
         dict_Two["出版社"] = dataStringOne
         if i.find('.') != -1:
            dict_Two["价格"] = dataStringTwo
         elif i.find('元') != -1:
            dict_Two["价格"] = dataStringTwo
         elif i.find('HKD') != -1:
            dict_Two["价格"] = dataStringTwo
         elif i.find('-') != -1:
            dict_Two["出版时间"] = dataStringTwo
         else:
            dict_Two["出版时间"] = dataStringTwo

运行结果及报错内容

img

我的解答思路和尝试过的方法
我想要达到的结果

希望将2013-8、2017、1987.3这类型的数据筛选出来

  • 写回答

5条回答 默认 最新

  • CSDN专家-HGJ 2022-04-29 14:44
    关注

    题中年份后面表示日月最多6个字符,试试如下代码:

    import re
    s=['新书/20200412/价格22.6元','旧书1/2010.3/价格10.5元','旧书2/2008-3-5/价格8.8元','新书1/2021-05-06/价格30元','新书2/2022/价格50元','中华书局《月读》编辑部 编著']
    res=[]
    for x in s:
        try:
            res.append(re.findall('\/(\d{4}[-.\d+]{0,6})\/', x)[0])
        except:
            res.append('')
    print(res)
    
    F:\2022\py01>t11
    ['20200412', '2010.3', '2008-3-5', '2021-05-06', '2022', '']
    
    本回答被题主选为最佳回答 , 对您是否有帮助呢?
    评论 编辑记录
查看更多回答(4条)

报告相同问题?

问题事件

  • 系统已结题 5月14日
  • 已采纳回答 5月6日
  • 创建了问题 4月29日

悬赏问题

  • ¥20 有关区间dp的问题求解
  • ¥15 多电路系统共用电源的串扰问题
  • ¥15 slam rangenet++配置
  • ¥15 有没有研究水声通信方面的帮我改俩matlab代码
  • ¥15 对于相关问题的求解与代码
  • ¥15 ubuntu子系统密码忘记
  • ¥15 信号傅里叶变换在matlab上遇到的小问题请求帮助
  • ¥15 保护模式-系统加载-段寄存器
  • ¥15 电脑桌面设定一个区域禁止鼠标操作
  • ¥15 求NPF226060磁芯的详细资料