如何将表格中的日期格式从2019-01-01转换为201901？

在处理Excel或CSV表格数据时，常需将标准日期格式（如2019-01-01）转换为年月简写形式（如201901），以便于数据分组或报表合并。常见问题是如何在保留数据完整性的同时，高效批量转换日期列。使用Excel公式如TEXT(A1,"yyyymm")可快速实现，但在Pandas中可通过df['date'].dt.strftime('%Y%m')完成。关键挑战包括原始数据格式不统一、空值处理及区域设置导致的解析错误。如何确保转换准确且兼容后续分析？

写回答
好问题 0 提建议
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

1条回答默认最新

蔡恩泽 2025-11-29 09:27

关注

1. 常见场景与基础实现方式

在数据处理中，将标准日期（如 2019-01-01）转换为年月简写（如 201901）是常见的预处理步骤，尤其适用于按月聚合、报表合并或时间维度索引构建。在Excel中，可通过公式 =TEXT(A1,"yyyymm") 实现快速转换；而在Python的Pandas环境中，则使用 .dt.strftime('%Y%m') 方法完成。

import pandas as pd

# 示例数据
data = {
    'date_str': ['2019-01-01', '2019-02-15', '2019-03-20', '2019-04-05',
                 '2019-05-10', '2019-06-22', '2019-07-08', '2019-08-14',
                 '2019-09-30', '2019-10-11', '2019-11-25', '2019-12-03']
}
df = pd.DataFrame(data)
df['date'] = pd.to_datetime(df['date_str'], errors='coerce')
df['year_month'] = df['date'].dt.strftime('%Y%m')

print(df[['date_str', 'year_month']])

2. 数据类型解析与标准化流程

原始数据常存在格式不统一问题，例如混合使用 2019/01/01、Jan 1, 2019 或纯数字（Excel序列号）。需通过 pd.to_datetime() 进行智能解析，并设置 errors='coerce' 将非法值转为 NaT（Not a Time），避免程序中断。

原始输入	解析结果	说明
2019-01-01	2019-01-01	ISO标准格式，直接识别
01/01/2019	2019-01-01	依赖locale或format参数
Jan 1, 2019	2019-01-01	英文月份缩写可识别
43466	NaT	Excel序列号需特殊处理
invalid_date	NaT	错误值被替换为空

3. 空值与异常值的鲁棒性处理策略

空值和异常格式是批量转换中的主要干扰因素。建议采用分层清洗策略：

第一步：使用 pd.to_datetime(..., errors='coerce') 统一转为 datetime 类型
第二步：检查 isna() 或 isnull() 标记缺失项
第三步：对缺失值决定填充逻辑（删除、向前填充、标记为“Unknown”等）
第四步：确保输出字段为字符串类型以支持后续拼接与分组操作

# 处理空值示例
df['date_clean'] = pd.to_datetime(df['date_str'], errors='coerce')
missing_count = df['date_clean'].isna().sum()
print(f"无效日期数量: {missing_count}")

# 转换前过滤空值
df['year_month_safe'] = df['date_clean'].dropna().dt.strftime('%Y%m')
df['year_month_safe'] = df['year_month_safe'].fillna('INVALID')

4. 区域设置与多语言环境兼容性分析

当数据源来自不同区域时，如中文“2019年1月1日”或法语“1 janvier 2019”，默认解析可能失败。应显式指定 format 参数或启用 dayfirst=True 等选项提升兼容性。

使用 format='%Y年%m月%d日' 解析中文日期
对非英语文本，可借助 locale 模块切换区域设置（注意线程安全）
推荐预清洗阶段将所有日期归一化为 ISO 格式（YYYY-MM-DD）
利用正则表达式提取关键字段作为备用方案

graph TD A[原始日期列] --> B{是否为标准格式?} B -- 是 --> C[直接pd.to_datetime] B -- 否 --> D[正则提取/格式映射] D --> E[转换为ISO标准] C --> F[处理NaT值] E --> F F --> G[dt.strftime('%Y%m')] G --> H[输出年月简写]

5. 高效批量处理与性能优化实践

面对百万级数据行，需关注向量化操作效率。避免使用 apply() 遍历逐行处理，优先使用 Pandas 内建的 .dt 访问器进行向量化转换。

# 正确做法：向量化操作
df['ym'] = df['date_col'].dt.strftime('%Y%m')

# 错误做法：低效循环
df['ym_bad'] = df['date_col'].apply(lambda x: x.strftime('%Y%m') if pd.notna(x) else None)

此外，可结合 chunksize 流式读取大文件，边加载边转换，减少内存峰值占用：

for chunk in pd.read_csv('large_data.csv', chunksize=10000):
    chunk['date'] = pd.to_datetime(chunk['date'], errors='coerce')
    chunk['year_month'] = chunk['date'].dt.strftime('%Y%m')
    process_and_save(chunk)

本回答被题主选为最佳回答 , 对您是否有帮助呢?

报告相同问题？

关注问题

js读取excel中日期格式转换问题
2021-11-13 13:55

蒲公英的博客如何读取Excel的数据我之前的文章有写，现在讲js读取excel中日期格式转换问题问题： excel自有的时间戳在读取excel时,会将2018/10/16这种数据自动装换成48264.12584511. 拿到的整数值是日期距离1900年1月1日的...
什么是数据转换？数据转换有哪些方式?
2025-06-10 20:13

Leo.yuan的博客数据转换作为数据处理流程中的关键枢纽，承担着将原始数据重塑为高价值资产的重要使命。它通过清洗、整合、标准化、结构化等一系列操作，统一不同数据源的差异，使分散的数据能够形成有机整体。无论是从业务系统中...
将CAD图纸数据转换为Excel表格的实用指南
2025-04-24 14:38

目楚的博客这些工具支持多种CAD文件格式，如DWG、DXF等，并能将提取的数据以表格形式导入到Excel中，极大地简化了工程师和设计师的数据处理流程。在数据转换过程中，规则定义是一个关键步骤，它能够帮助自动化工具根据用户的...
R 语言几种处理日期并转换成时间序列的例子
2021-02-10 11:18

_思露_的博客从文件中提取日期建议用setwd()为R项目选择一个合适的环境。 #读取working directory目录下的文件dataset。 df1 <- read.table('dataset.txt',header = T) 如果日期格式为20210210（YMD）：可以这样提取提取...
大模型LLM ACA - ACP认证考试真题冲刺演练四
2026-03-29 13:31

张彦峰ZYF的博客真题演练包含50道单选题（每题1分）和25道多选题（每题2分），总分100分，80分及格，考试时长为120分钟。
通用大模型应用案例--处理excel表格
2024-09-22 21:58

見贤思齊的博客将excel表格中的行转换为字典格式，为下一步处理数据做准备。自己python代码能力不强，把需求告诉通义千问大模型，提示词如下：第一次提示词：你是Python专家，擅长编写python程序，尤其在自动化办公excel处理方面...
【Vue】全局日期格式化
2023-12-15 15:25

花北城的博客我个人将移动端开发，分为两大方向：①原生开发最早一批，使用安卓开发工具包（Android SDK）和Java语言来开发App的方式。原生开发允许开发者充分利用安卓平台的功能和特性，以及庞大的安卓开发社区资源。
excel更改日期格式无效_Excel日期不会更改格式
2020-08-08 15:47

culiao2169的博客 excel更改日期格式无效 Excel日期不会更改格式 (Excel Dates Won’t Change Format) Have you ever imported data into Excel, from your credit card statement, or somewhere else, and found that Excel dates ...
WPS JS宏编程教程（从基础到进阶）-- 第八部分：字符串技术与WPS结合应用
2025-04-15 21:13

帮带做的博客 /) 匹配结果 → "1,234.56" ↓ replace(/,/g, "") 转换数字 → 1234.56 8-8 字符组与任选：灵活匹配逻辑场景：识别多种日期格式需要兼容“2023-09-01”“2023/09/01”“20230901”三种格式的日期。字符组与任选符...
WPS JS宏编程教程（从基础到进阶）-- 第四部分：函数与自定义功能开发
2025-04-01 23:29

帮带做的博客 1. 函数的创建与调用**基础概念****1.1 命名函数与匿名...**2.2 RGB颜色转换函数****功能**：将RGB值转换为WPS可用的颜色代码。3. 高阶函数应用**3.1 map函数：批量处理数据****功能**：将区域内的数值统一增加10%。
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
已采纳回答 11月30日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 11月29日