Sinestro 2022-04-29 12:38 采纳率: 87.5%
浏览 280
已结题

请问Python正则表达式如何匹配连续的四位数字

问题遇到的现象和发生背景

在用python处理excel时,想用正则表达式区分时间和价钱,字符串有如下几种类型:15.70元 2013-8 2017 228.00 1987.3 如下几种类型
我现在想要用正则表达式筛选出2013-8、2017、1987.3这个样子的数据,将其放到字典{‘出版时间’:''}字段,其余数字放入价钱字段

问题相关代码,请勿粘贴截图
elif dataIndex == 0:
         i.find('.')
         i.find('元')
         i.find('HKD')
         i.find('-')
         dict_Two["出版社"] = dataStringOne
         if i.find('.') != -1:
            dict_Two["价格"] = dataStringTwo
         elif i.find('元') != -1:
            dict_Two["价格"] = dataStringTwo
         elif i.find('HKD') != -1:
            dict_Two["价格"] = dataStringTwo
         elif i.find('-') != -1:
            dict_Two["出版时间"] = dataStringTwo
         else:
            dict_Two["出版时间"] = dataStringTwo

运行结果及报错内容

img

我的解答思路和尝试过的方法
我想要达到的结果

希望将2013-8、2017、1987.3这类型的数据筛选出来

  • 写回答

5条回答 默认 最新

  • CSDN专家-HGJ 2022-04-29 14:44
    关注

    题中年份后面表示日月最多6个字符,试试如下代码:

    import re
    s=['新书/20200412/价格22.6元','旧书1/2010.3/价格10.5元','旧书2/2008-3-5/价格8.8元','新书1/2021-05-06/价格30元','新书2/2022/价格50元','中华书局《月读》编辑部 编著']
    res=[]
    for x in s:
        try:
            res.append(re.findall('\/(\d{4}[-.\d+]{0,6})\/', x)[0])
        except:
            res.append('')
    print(res)
    
    F:\2022\py01>t11
    ['20200412', '2010.3', '2008-3-5', '2021-05-06', '2022', '']
    
    本回答被题主选为最佳回答 , 对您是否有帮助呢?
    评论 编辑记录
查看更多回答(4条)

报告相同问题?

问题事件

  • 系统已结题 5月14日
  • 已采纳回答 5月6日
  • 创建了问题 4月29日

悬赏问题

  • ¥15 请问各位,如何在Jetson nano主控板的Ubuntu系统中安装PyQt5
  • ¥15 MAC安装佳能LBP2900驱动的网盘提取码
  • ¥400 微信停车小程序谁懂的来
  • ¥15 ATAC测序到底用什么peak文件做Diffbind差异分析
  • ¥15 安装ubantu过程中第一个vfat 文件挂载失败
  • ¥20 GZ::CTF如何兼容一些靶机?
  • ¥15 etcd集群部署问题
  • ¥20 谁可以帮我一下问一下各位
  • ¥15 为何重叠加权后love图的SMD与svyCreateTableOne函数绘制基线表的不一致
  • ¥150 求 《小魔指》街机游戏机整合模拟软件