h08.14 2023-06-10 15:32 采纳率: 50%
浏览 22
已结题

python数据分析数据集的清洗

img


这个数据集里面的第一列时间有两种书写方式一种是年月日一种是日月年 如何将两种时间格式统一成一种

  • 写回答

2条回答 默认 最新

  • threenewbee 2023-06-10 15:40
    关注

    假设文件叫做example.xlsx
    时间列是A列
    那么代码如下(相关用到的库,你可以pip install下)

    
    import datetime
    from dateutil import parser
    from openpyxl import Workbook, load_workbook
    
    old_format1 = "%Y-%m-%d %H:%M" #第一种格式
    old_format2 = "%m/%d/%y %H:%M" #第二种格式
    
    new_format = "%Y-%m-%d %H:%M" #新格式
    
    wb = load_workbook(filename="example.xlsx")
    ws = wb.active
    
    for cell in ws['A']:
        if cell.row == 1:
            continue
        # 使用dateutil模块解析日期
        try:
            date_obj = parser.parse(cell.value)
            # 如果日期是第二种格式,将其转换为第一种格式
            if cell.value[:1].isdigit():
                cell.value = date_obj.strftime(new_format)
        except ValueError:
            pass
    
    wb.save("example.xlsx")
    
    
    本回答被题主选为最佳回答 , 对您是否有帮助呢?
    评论
查看更多回答(1条)

报告相同问题?

问题事件

  • 系统已结题 6月19日
  • 已采纳回答 6月11日
  • 创建了问题 6月10日