Pandas如何实现类似Excel的合并单元格效果？

如何在Pandas中实现类似Excel的合并单元格效果，使导出的Excel表格中相同类别的行标签仅显示一次？常见需求如按部门分组时，希望“部门”列中重复值被合并，视觉上更清晰。直接使用Pandas的`to_excel()`无法自动合并单元格，需借助`openpyxl`或`xlsxwriter`等引擎手动操作单元格。但难点在于如何精确定位需合并的单元格范围，并避免数据错位。此外，合并后格式设置（如居中、边框）也需额外配置。如何结合`groupby`逻辑与样式API高效实现此功能？

写回答
好问题 0 提建议
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

1条回答默认最新

The Smurf 2025-11-23 09:57

关注

如何在Pandas中实现类似Excel的合并单元格效果

在数据处理与报表生成过程中，将Pandas数据导出为Excel并实现“合并单元格”是常见的需求。尤其是在按类别（如部门、区域）分组时，用户期望相同类别的行标签仅显示一次，以提升可读性。然而，pandas.DataFrame.to_excel() 默认不支持自动合并单元格，必须借助第三方引擎和样式API手动控制单元格行为。

1. 基础认知：Pandas与Excel导出机制

Pandas使用to_excel()方法将DataFrame写入Excel文件。
底层依赖于openpyxl或xlsxwriter作为写入引擎。
默认情况下，每个单元格独立存在，无视觉上的合并逻辑。
要实现合并单元格，需在写入后访问工作表对象，并调用其原生API进行操作。

例如，以下是一个基础的导出流程：

import pandas as pd

df = pd.DataFrame({
    '部门': ['技术部', '技术部', '销售部', '销售部', '人事部'],
    '员工': ['张三', '李四', '王五', '赵六', '钱七'],
    '薪资': [18000, 17000, 10000, 9500, 8000]
})

with pd.ExcelWriter('output.xlsx', engine='openpyxl') as writer:
    df.to_excel(writer, index=False, sheet_name='员工信息')

2. 深入分析：为何需要手动合并？

部门	员工	薪资
技术部	张三	18000
技术部	李四	17000
销售部	王五	10000
销售部	赵六	9500
人事部	钱七	8000

从上表可见，“部门”列存在重复值。理想状态下应合并相同部门的单元格。但Pandas本身不具备此功能，必须结合分组逻辑与Excel操作API完成。

3. 解决方案设计：结合groupby与openpyxl实现合并

核心思路如下：

使用groupby识别连续相同值的区间。
计算每组起始行和结束行索引。
利用openpyxl的merge_cells()方法合并指定范围。
设置对齐方式、边框等格式增强可读性。

4. 实现步骤详解

以下代码展示完整实现过程：

import pandas as pd
from openpyxl.styles import Alignment, Border, Side
from openpyxl.utils import get_column_letter

# 构造示例数据
data = {
    '部门': ['技术部']*3 + ['销售部']*2 + ['人事部']*2,
    '团队': ['前端', '后端', '算法', '华东区', '华南区', '行政', 'HR'],
    '员工': ['A', 'B', 'C', 'D', 'E', 'F', 'G'],
    '薪资': [20000, 19000, 22000, 11000, 10500, 8000, 8200]
}
df = pd.DataFrame(data)

# 写入Excel并获取workbook和worksheet
with pd.ExcelWriter('merged_output.xlsx', engine='openpyxl') as writer:
    df.to_excel(writer, index=False, sheet_name='分组报表')
    
    workbook = writer.book
    worksheet = writer.sheets['分组报表']

    # 定义样式
    center_aligned = Alignment(horizontal='center', vertical='center')
    thin_border = Border(
        left=Side(style='thin'),
        right=Side(style='thin'),
        top=Side(style='thin'),
        bottom=Side(style='thin')
    )

    # 获取“部门”列索引（A列）
    col_idx = 1  # A列对应索引1
    current_dept = None
    start_row = None

    for row_idx in range(2, len(df) + 2):  # Excel行从2开始（第1行为标题）
        dept = worksheet.cell(row=row_idx, column=col_idx).value

        if dept != current_dept:
            # 如果不是第一组，先合并前一组
            if current_dept is not None and start_row is not None:
                if row_idx - 1 > start_row:
                    worksheet.merge_cells(start_row=start_row, start_column=col_idx,
                                          end_row=row_idx-1, end_column=col_idx)
                # 应用居中+边框
                cell = worksheet.cell(row=start_row, column=col_idx)
                cell.alignment = center_aligned
                cell.border = thin_border

            # 开启新组
            current_dept = dept
            start_row = row_idx
        else:
            # 清除当前单元格内容，准备合并
            worksheet.cell(row=row_idx, column=col_idx).value = None

    # 处理最后一组
    if start_row is not None:
        last_row = len(df) + 1
        if last_row > start_row:
            worksheet.merge_cells(start_row=start_row, start_column=col_idx,
                                  end_row=last_row, end_column=col_idx)
        cell = worksheet.cell(row=start_row, column=col_idx)
        cell.alignment = center_aligned
        cell.border = thin_border

    # 自动调整列宽
    for col in worksheet.columns:
        max_length = 0
        column = col[0].column_letter
        for cell in col:
            try:
                if len(str(cell.value)) > max_length:
                    max_length = len(str(cell.value))
            except:
                pass
        adjusted_width = min(max_length + 2, 50)
        worksheet.column_dimensions[column].width = adjusted_width

5. 流程图：合并单元格逻辑执行路径

graph TD A[开始导出DataFrame] --> B{遍历每一行} B --> C[判断当前部门是否变化] C -- 是 --> D[合并前一组单元格] C -- 否 --> E[清空当前单元格] D --> F[记录新组起始行] E --> F F --> G[继续下一行] G --> B B --> H[处理最后一组合并] H --> I[应用样式与列宽调整] I --> J[保存Excel文件]

6. 高级优化建议

对于复杂场景（多级分组、跨列合并），可扩展如下策略：

使用itertools.groupby预处理行索引区间，提高性能。
封装成通用函数，支持任意列名与分组层级。
结合条件格式（Conditional Formatting）突出分组边界。
考虑使用xlsxwriter引擎的write_blank()和merge_range()简化操作。

此外，在大数据量下应注意内存占用与写入效率，避免频繁访问单个单元格。

本回答被题主选为最佳回答 , 对您是否有帮助呢?

报告相同问题？

关注问题

excel合并单元格导入
2020-08-26 16:52

标题“Excel合并单元格导入”涉及的是在编程环境中处理Excel数据时，如何处理那些具有合并单元格的表格。在Excel中，合并单元格通常用于格式化或者突出显示重要的信息，但在进行数据导入或分析时，这可能会带来挑战...
【python】基于pandas的EXCEL合并方法
2024-06-11 16:28

码银的博客本文介绍了一种使用Python编程语言中的Pandas库和Glob模块来自动化合并Excel文件的方法。通过编写简洁的脚本，我们可以高效地搜索、读取、合并以及保存大量Excel文件，极大地提高了数据处理的效率。关键词：Python, ...
python操作openpyxl导出Excel 设置单元格格式及合并处理代码实例
2020-09-18 18:03

# 合并单元格 worksheet.merge_cells(start_row=1, start_column=1, end_row=1, end_column=3) ``` 这个函数会合并从第一行第一列到第一行第三列的所有单元格。处理复杂场景，比如按日期合并相同日期的行： ```...
Python自动取消Excel合并单元格回复取消后的文件
2023-04-25 16:16

标题为"Python自动取消Excel合并单元格回复取消后的文件"，这表明我们有一个Python程序，它的功能是将含有合并单元格的Excel工作表还原到合并前的状态。描述中提到，这个程序具备GUI（图形用户界面），这意味着...
Pandas常用操作，多个Excel合并成1个Excel
2024-07-08 17:49

编程阿布的博客在Pandas中，将多个Excel文件合并成一个Excel文件是一个常见的需求。这通常涉及到读取每个Excel文件为一个DataFrame，然后将这些DataFrame合并（可能是通过连接concat或合并merge，具体取决于你的需求），最后将合并...
python实现在Excel表格中将上下行相同内容的单元格自动合并
2022-07-03 11:08

# 合并单元格 df.iloc[i - 1, column_names] += df.iloc[i, column_names] # 删除重复行 df.drop(index=df.index[i], inplace=True) ``` 在这个函数中，我们遍历`DataFrame`的每一行，比较当前行与前一行的指定...
结构相同的excel表格，如何实现自动批量合并？
2025-01-07 12:10

本文将介绍如何使用Python编程语言及其相关的库来实现Excel表格的自动批量合并。首先，Python中有几个强大的库可以用来操作Excel文件，例如`openpyxl`和`pandas`。`pandas`库由于其简洁的API和强大的数据处理能力...
利用Pandas拆分Excel的单元格为多行并保留其他行的数据
2019-07-16 18:35

Jock2018的博客利用Pandas拆分Excel的单元格为多行并保留其他行的数据1. 需求2. Pandas解决需求2.1 准备工作2.2 Python程序执行3. Pandas实现需求过程详解 1. 需求需求：对Excel中的C列（标红）所有单元格的内容进行拆分，同时...
Python基于xlrd模块处理合并单元格
2020-12-17 11:06

本篇文章将详细介绍如何使用xlrd模块来处理Excel文件中的合并单元格。首先，要使用xlrd库，你需要通过pip安装它： ```bash pip install xlrd ``` 安装完成后，你可以导入xlrd库并开始读取Excel文件。以下是一个...
python在Excel表格中将上下行相同内容的单元格自动合并
2022-11-04 16:25

本教程将重点讲解如何使用Python库，如pandas和openpyxl，来实现一个功能：检查并合并Excel表格中上下行相同内容的单元格。这样的操作可以优化数据展示，减少冗余，提高工作效率。首先，我们需要导入必要的库。`...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
已采纳回答 11月24日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 11月23日