不想学习hhh 2022-09-24 21:59 采纳率: 85.7%
浏览 64
已结题

pandas检查日期格式

问题遇到的现象和发生背景

有一组未清理的dataframe,如下:
date time order_type
2021-11-03 18:08:27 Dinner
2021-19-12 10:11:49 Breakfast
2021-fri-17 17:38:01 Dinner
Fri Apr 2 00:00:00 2021 18:38:52 Dinner
2021-01-08 08:10:08 Breakfast

用代码块功能插入代码,请勿粘贴截图

我想来检查这个dataframe中的日期是否是“年份-日期-月份”的格式,并且定位到格式错误的所在行,请问要如何实现呢

  • 写回答

3条回答 默认 最新

  • Java大魔王 2022-09-25 10:05
    关注

    不仅要校验格式的合法性,还要校验日期的合法性:

    import pandas as pd
    df = pd.DataFrame([
            {'date': '2021-11-03', 'time': '18:08:27', 'order_type': 'Dinner'},
            {'date': '2021-19-12', 'time': '10:11:49', 'order_type': 'Breakfast'},
            {'date': '2021-fri-17', 'time': '17:38:01', 'order_type': 'Dinner'},
            {'date': 'Fri Apr 2 00:00:00', 'time': '18:38:52', 'order_type': 'Dinner'},
            {'date': '2021-01-08', 'time': '08:10:08', 'order_type': 'Breakfast'}
        ])
    reg = re.compile('^((((19|20)\d{2})(0[13-9]|1[012])(0[1-9]|[12]\d|30))|(((19|20)\d{2})(0[13578]|1[02])31)|'
                         '(((19|20)\d{2})02(0[1-9]|1\d|2[0-8]))|((((19|20)([13579][26]|[2468][048]|0[48]))|'
                         '(2000))0229))$')
    invalid_df = df[df['date'].apply(lambda x: reg.match(x.replace('-', '')) is None)]
    

    原数据:

    img

    筛选出的非法数据:

    img

    本回答被题主选为最佳回答 , 对您是否有帮助呢?
    评论 编辑记录
查看更多回答(2条)

报告相同问题?

问题事件

  • 已结题 (查看结题原因) 9月27日
  • 已采纳回答 9月27日
  • 创建了问题 9月24日

悬赏问题

  • ¥15 phython如何实现以下功能?查找同一用户名的消费金额合并—
  • ¥15 孟德尔随机化怎样画共定位分析图
  • ¥18 模拟电路问题解答有偿速度
  • ¥15 CST仿真别人的模型结果仿真结果S参数完全不对
  • ¥15 误删注册表文件致win10无法开启
  • ¥15 请问在阿里云服务器中怎么利用数据库制作网站
  • ¥60 ESP32怎么烧录自启动程序
  • ¥50 html2canvas超出滚动条不显示
  • ¥15 java业务性能问题求解(sql,业务设计相关)
  • ¥15 52810 尾椎c三个a 写蓝牙地址