在python，求下列要求的速度快的方法：有一个pandas的df，需要将其分组，然后在每个分组中求最大值与平均值的比值，再将这个比值添加到df中

比如，有一个df，是ABCD四个班共10个小孩的年龄：
import pandas as pd
import numpy as np

data_dict = { "class":['A','B','A','C','D','B','C','A','D','C'] , 'age':[ 8, 11, 9, 12, 16, 6, 7, 10, 13, 5]}

data_df = pd.DataFrame(data_dict)

现在，需要将data_df按班级分组，求得每个班级的最大的年龄与每个班级的平均年龄的比值"ratio_age"，并且data_df新增一列，以添加“ratio_age”。请问怎么做，才能够达到运算时速度最快（尽可能最快）？

写回答
好问题 0 提建议
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

1条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
chuifengde 2021-12-07 11:40
关注
import pandas as pd data_dict = { "class":['A','B','A','C','D','B','C','A','D','C'] , 'age':[ 8, 11, 9, 12, 16, 6, 7, 10, 13, 5]} data_df = pd.DataFrame(data_dict) data_df['ratio_age'] = data_df.groupby('class')['age'].transform(lambda x: max(x) / (sum(x) / len(x))) print(data_df)
本回答被题主选为最佳回答 , 对您是否有帮助呢?

解决无用
评论打赏
分享
举报编辑记录

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

前锋python百度云_关于python：使用索引在pandas DataFrame中设置特定单元格的值
2020-12-04 16:42

weixin_39725154的博客我创建了一个熊猫数据框架df = DataFrame(index=['A','B','C'], columns=['x','y'])得到了这个x yA NaN NaNB NaN NaNC NaN NaN然后我想给特定的单元格赋值，例如行"c"和列"x"。我期望得到这样的结果：x yA NaN NaNB ...
【Python】【Pandas】精讲Pandas模块常用函数
2024-03-15 10:00

风云说通信的博客 Pandas 是一个开源的第三方 Python 库，从 Numpy 和 Matplotlib 的基础上构建而来，享有数据分析“三剑客之一”的盛名（NumPy、Matplotlib、Pandas）。Pandas 已经成为 Python 数据分析的必备高级工具，它的目标是...
python：pandas（1）
2021-08-24 15:34

coming back的博客作为 Python 语言的一个第三方库，Pandas 在程序中可以很方便的进行引用。但是不得不说的是。Pandas 是在 Python 的另一个科学计算库 Numpy 的基础上进行开发的，因此 Pandas 采用了大量的 Numpy 编码风格。但它在...
python pandas 讲解ppt_python-pandas-数据分析技术与编程方法讲座ppt
2020-12-15 21:07

weixin_39775577的博客 PPT内容这是python-pandas-数据分析技术与编程方法讲座ppt，包括了Python入门，开发环境IDE，pandas数据分析库，数据规整化，数据聚合与分组，实例分析——泰坦尼克之灾等内容，欢迎点击下载。Python Pandas 数据...
800道Python习题，花了一个月终于整理出来了，挑战一下自己能做对多少题
2022-04-21 13:56

轻松学Python的博客文章目录序言话不多说...一、填空题二、判断题三、问答题序言最近沉寂的太久了，只为了给大家准备这一套试题，这大概是全网最全面的了，各位学这么久Python，检验学习成果的时间到了！！话不多说我们直接开始把！
Pandas整理（一）
2025-01-11 17:47

Fuction.的博客 sdata = pd.Series([i for i in range(6)], index=[i for i in 'ABCDEF']) print(sdata) print(sdata.index) print(sdata.values) ...'E', 'F'], dtype='object') [0 1 2 3 4 5]使用字典加列表创建df，使默认自增索引。
基础python数据挖掘笔记数据分析(基础matplotlib，numpy，pandas的使用)
2024-04-28 20:22

小土king的博客 x要显示的刻度# y:y要显示的刻度# 温度变化折线图# 1、准备数据# 2、创建画布# 3、绘制图像# 修改x y刻度x_label = ["11分{}秒".format(i) for i in x]# 4、显示图像plt.show()Numpy (Numerical Python) 是一个开源...
python numpy pandas 书全_python之numpy、scipy、pandas、matplotlib的读书报告
2021-02-02 23:41

胡安黄的博客 NumPy 是一个运行速度非常快的数学库，主要用于数组计算，包含：一个强大的N维数组对象 ndarray。广播功能函数。整合 C/C++/Fortran 代码的工具。线性代数、傅里叶变换、随机数生成等功能。Numpy的安装使用已...
【Python 基础教程 17】全面掌握Python3：入门到精通的函数编程实用指南
2023-06-20 22:42

泡沫o0的博客在Python3中，函数（Function）是一个由语句块构成的可重用部分，用于执行一个特定的任务。
Python和Excel的完美结合:常用操作汇总(案例详析)
2022-09-08 20:59

叫我邱哥的博客因为Excel画出来的图能够交互，能够在图上进行一些简单操作，所以这里用的python的可视化库是plotly，案例就用我这个学期发展经济学课上的作业吧，当时的图都是用Excel画的，现在用python再画一遍。
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
系统已结题 12月19日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
已采纳回答 12月11日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 12月7日

在python，求下列要求的速度快的方法：有一个pandas的df，需要将其分组，然后在每个分组中求最大值与平均值的比值，再将这个比值添加到df中

1条回答 默认 最新

问题事件

1条回答默认最新