dataframe 分类排序问题2

我之前问过类似的问题，见链接： https://ask.csdn.net/questions/7409644

现在碰到更复杂的问题，我需要对dataframe按照类分类，每类按照该类data2的值最大的时候的data1值过滤该类，然后排序，请问该如何优化？

我把整数改成浮点数，更精确一点，代码如下：

import numpy as np
import pandas as pd

df = pd.DataFrame()
n = 200
df['category'] = np.random.choice(('A', 'B'), n)
df['data1'] = np.random.rand(len(df))*100
df['data2'] = np.random.rand(len(df))*100

a = df[df['category'] == 'A']
c = a[a['data2'] == a.data2.max()].data1.max()
a = a[a['data1'] <= c]
a = a.sort_values(by='data2', ascending=False).head(4)

b = df[df['category'] == 'B']
c = b[b['data2'] == b.data2.max()].data1.max()
b = b[b['data1'] <= c]
b = b.sort_values(by='data2', ascending=False).head(4)

df = pd.concat([a, b]).sort_values(by=['category', 'data1'], ascending=[True, False]).reset_index(drop=True)
print(df)

结果为：

  category      data1      data2
0        A  77.453241  98.628388
1        A  54.786469  97.470081
2        A  19.618200  96.261181
3        A   9.031004  97.067451
4        B  50.751809  99.219009
5        B  47.546003  96.488705
6        B  32.735357  98.565826
7        B  14.092039  95.359450

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

3条回答默认最新

ProfSnail 2021-03-26 14:16

关注

使用groupby方法。

import numpy as np
import pandas as pd
 
df = pd.DataFrame()
n = 200
df['category'] = np.random.choice(('A', 'B'), n)
df['data1'] = np.random.randint(1, 100, len(df))
df['data2'] = np.random.randint(1, 100, len(df))
print(df)

rowIndex = pd.Series()
for name, group in df.groupby('category'):
	heading = group[group['data1']<group['data2'].max()].sort_values(by='data2', ascending=False).head(4)
	rowIndex = pd.concat([rowIndex, pd.Series(heading.index)])
out = df.loc[rowIndex]
print(out)

    category  data1  data2
71         A     23     99
115        A     58     96
167        A     87     95
174        A     12     95
119        B     12     99
135        B     12     98
117        B     90     98
88         B     19     97

本回答被题主选为最佳回答 , 对您是否有帮助呢?

查看更多回答(2条)

报告相同问题？

关注问题

dataframe 分类排序问题2 python
2021-03-26 14:00

回答 3 已采纳使用groupby方法。 import numpy as np import pandas as pd df = pd.DataFrame() n = 200 df['category'] =
dataframe分类排序优化问题 python
2021-03-24 19:23

回答 1 已采纳试试这个 temp = df.groupby('category')['data'].nlargest(4).reset_index() temp.drop('level_1',axis=1)
dataframe分组新增排序 python
2022-05-22 18:44

回答 1 已采纳没什么简便方法，提取年月，年*12+月与最小年月相减
Python 实现DataFrame数据的排序或排名 Python源码
2023-11-11 09:14

Python 实现DataFrame数据的排序或排名 Python源码Python 实现DataFrame数据的排序或排名 Python源码Python 实现DataFrame数据的排序或排名 Python源码Python 实现DataFrame数据的排序或排名 Python源码Python 实现...
Python pandas 多重索引按不同需求排序 python
2019-03-25 15:59

回答 1 已采纳 ``` df.sort_values(by=["class", "id"],ascending=[True, False]) ``` _可以实现排序,想要索引完备就在末尾再加个reset_ind
Dataframe列的排序 python 有问必答
2021-08-19 19:01

回答 2 已采纳对一个数据框根据某行数值对列进行排序，使用pandas中的sort_values。示例： import pandas as pd df=pd.DataFrame(data=[[12,10,6,8,11
python使用pandas处理dataFrame python 数据分析数据挖掘
2022-02-14 09:49

回答 1 已采纳按照题主提供的图片，默认日期格式为excel日期格式YYYY/MM/DD等，要求位置单元格居右（而如果以str属性读取，内容会单元格居左）我觉得你的文件可能还有后续的分析任务，所以建议结果文件中日期格
Python 对DataFrame数据分组并排序并选择最优数据
2020-12-21 10:58

Python 对DataFrame数据分组并排序并选择最优数据目的：对数据按第一列分组，按第二列降序排序，按第三列升序排序，选择每组中最好的输出数据：开始： import pandas as pd df = pd.read_excel('product.xlsx',...
python聚类问题 python 聚类
2022-12-08 19:05

回答 1 已采纳你的数据中有非数值型的字符串型数据，你检查一下新使用的数据
导入xlsx文件为DataFrame类型，转换为列表，分词后中括号和引号无法去除 python 有问必答
2021-09-11 21:44

回答 2 已采纳转换为列表之后再用 " ".join()拼接成字符串不行吗?
怎么用python按姓名长度进行排序 python
2021-12-16 16:45

回答 2 已采纳 import pandas as pd data = [['Sun', 1, 6, 5], ['Jack', 2, 7, 4], ['Alice' , 3, 8, 3], ['Helen' ,
python dataframe列名排序
2023-06-16 16:01

qq_27866857的博客【代码】python dataframe列名排序。
DataFrame isin 顺序跑掉 python
2021-05-12 00:08

回答 2 已采纳试试创建一个lis = recomnended_food['Dishes_id'].unique().tolist() 然后 isin() 改成 isin(lis)
Pandas 对Dataframe结构排序的实现方法
2020-09-20 15:37

下面小编就为大家分享一篇Pandas 对Dataframe结构排序的实现方法，具有很好的参考价值，希望对大家有所帮助。一起跟随小编过来看看吧
python dataframe排序_DataFrame(12)：DataFrame的排序与排名问题
2020-11-28 13:11

weixin_39636691的博客 1、说明DataFrame中的排序分为两种，一种是对索引排序，一种是对值进行排序。索引排序：sort_index()；值排序：sort_values()；值排名：rank()对于索引排序，涉及到对行索引、列索引的排序，并且还涉及到是升序还是...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
已结题（查看结题原因） 8月19日

悬赏问题

¥15 r语言神经网络自变量重要性分析
¥15 基于双目测规则物体尺寸
¥15 wegame打不开英雄联盟
¥15 公司的电脑，win10系统自带远程协助，访问家里个人电脑，提示出现内部错误，各种常规的设置都已经尝试，感觉公司对此功能进行了限制（我们是集团公司）
¥15 救！ENVI5.6深度学习初始化模型报错怎么办？
¥30 eclipse开启服务后，网页无法打开
¥30 雷达辐射源信号参考模型
¥15 html+css+js如何实现这样子的效果？
¥15 STM32单片机自主设计
¥15 如何在node.js中或者java中给wav格式的音频编码成sil格式呢

dataframe 分类排序问题2

3条回答 默认 最新

问题事件

悬赏问题

3条回答默认最新