python 分组计算百分比问题

在用pd.pivot_table处理完原始表格后，想实现df.groupby函数的分组内百分比计算遇到难题。

df = pd.read_excel("测试1 - 副本.xlsx")
df=pd.DataFrame(df)
s1=df.groupby(["业务员ID","险种","是否续保","保费"]).aggregate({"保费":np.sum})
ds=s1.groupby(level="保费").apply(lambda x: x*100/float(x.sum()))
ds

显示结果为:

但实际要想的结果为：

写回答
好问题 0 提建议
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

5条回答默认最新

Java大魔王 2022-12-05 08:58

关注


import pandas as pd

if __name__ == '__main__':
    df = pd.DataFrame([{"业务员ID": "A", "险种": "安全生产责任保险(B)", "是否续保": "否", "保费": 8867.93, "件数": 4},
                       {"业务员ID": "A", "险种": "安全生产责任保险(B)", "是否续保": "是", "保费": 1067.93, "件数": 8},
                       {"业务员ID": "B", "险种": "安全生产责任保险(B)", "是否续保": "否", "保费": 2547.17, "件数": 6},
                       {"业务员ID": "B", "险种": "安全生产责任保险(B)", "是否续保": "是", "保费": 9865.17, "件数": 3},
                       {"业务员ID": "C", "险种": "食品安全责任保险", "是否续保": "是", "保费": 2377.36, "件数": 8},
                       {"业务员ID": "D", "险种": "安全生产责任保险(B)", "是否续保": "否", "保费": 2452.84, "件数": 20},
                       {"业务员ID": "E", "险种": "个人责任保险", "是否续保": "否", "保费": 118.68, "件数": 1},
                       {"业务员ID": "F", "险种": "安全生产责任保险(B)", "是否续保": "否", "保费": 52641.54, "件数": 2},
                       {"业务员ID": "G", "险种": "个人责任保险", "是否续保": "否", "保费": 26.22, "件数": 9}])
    result = []
    for key, itemGroup in df.groupby(['业务员ID', '险种']):
        feeTotal = itemGroup['保费'].sum()
        numTotal = itemGroup['件数'].sum()
        itemGroup['业务员ID'] = key[0]
        itemGroup['险种'] = key[1]
        itemGroup['保费占比'] = round(100 * itemGroup['保费'] / feeTotal, 2).apply(lambda x: str(x) + "%")
        itemGroup['件数占比'] = round(100 * itemGroup['件数'] / numTotal, 2).apply(lambda x: str(x) + "%")
        result.append(itemGroup)
    resultDf = pd.concat(result)
    print(resultDf)

原始数据:

结果：

本回答被题主选为最佳回答 , 对您是否有帮助呢?

编辑记录

查看更多回答(4条)

报告相同问题？

关注问题

python计算序列中的数值在某一范围的占比怎么算
2024-07-06 03:11

良伦的博客 Python,编程语言,编程相关视频讲解：python的or运算赋值用法用python编程Excel有没有用处？011_编程到底好玩在哪？查看python文件_输出py文件_cat_运行python文件_shel项目方案：计算序列中的数值在某一范围的占比 1...
【Python--网络编程之Ping命令的实现】
2024-02-12 12:53

码上有前的博客使用Python网络编程实现Ping命令
Python库 | ESClient-0.2.1.tar.gz
2022-03-04 06:25

5. **聚合分析**：支持多种聚合函数，如求和、平均值、最大值、最小值等，以及桶型聚合（例如，按时间分组）和管道聚合（如计算百分比）。 6. **脚本字段和脚本评分**：允许在查询过程中动态计算字段值或影响文档...
基于Python的GitHub项目爬取与编程语言趋势分析系统设计与实现
2025-08-14 09:31

Python爬虫项目的博客本文详细介绍了一个基于Python的GitHub项目爬取与编程语言趋势分析系统的设计与实现。系统利用GitHub API v4(GraphQL)高效获取项目数据，使用异步爬虫技术提升采集效率，并通过数据可视化展示编程语言的发展趋势。...
数学建模——Python绘图（可视化）
2024-06-01 19:30

RechoYit的博客 style='Gender'：根据 "Gender" 列进行分组，并使用不同的标记样式来表示不同的分组。data=insurance：指定要使用的数据集，这里使用名为 'insurance' 的数据集。hue='Gender'：根据 "Gender" 列进行分组，并使用...
Python头歌集合（部分参考题解）
2023-11-07 10:11

book大人的博客头歌Python参考题解
python中计算正方形面积的方法_Python中ScikitLearn库的分类方法总览
2020-12-31 05:56

吴玄熙的博客简介你是一个正在进入机器学习领域的Python程序员吗? 掌握Scikit-Learn就是一个开启你的旅程的很好的方式。使用Scikit-Learn进行一些分类是应用你所学到的知识的一种直接而简单的方法，通过使用一个用户友好的、文档...
python数据分析——数据分类汇总与统计
2024-06-30 18:41

鲜于言悠905的博客 Python作为一种高效、简洁且易于学习的编程语言，在数据分析领域展现出了强大的实力。本文将介绍如何使用Python进行数据分类汇总与统计，帮助读者更好地理解和应用数据。首先，我们需要导入一些常用的Python库，如...
Python机器学习：从入门到精通
2025-07-18 17:01

莲华君的博客本书将带您，以Python为舟，泛游于算法之海。我们不只传授“术”，更探求其后的“道”——从数据的生灭流转中观照规律，于模型的迭代演进里体悟得失。愿您合上书卷时，收获的不仅是驾驭数据的技能，更有一双洞悉复杂...
Python库 | tableone-0.4.9-py2.py3-none-any.whl
2022-02-19 23:19

Python作为一种强大的编程语言，在数据处理和分析领域有着广泛的应用。在众多的Python库中，`tableone`是一个专为快速创建简洁、美观的数据概况表而设计的工具，尤其适用于科研和数据分析场景。本文将深入探讨`...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
系统已结题 12月13日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
已采纳回答 12月5日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
修改了问题 12月4日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 12月4日

python 分组计算百分比问题

5条回答 默认 最新

问题事件

5条回答默认最新