https://leetcode.cn/problems/game-play-analysis-ii/
Table: Activity
+--------------+---------+
| Column Name | Type |
+--------------+---------+
| player_id | int |
| device_id | int |
| event_date | date |
| games_played | int |
+--------------+---------+
(player_id, event_date) 是这个表的两个主键(具有唯一值的列的组合)
这个表显示的是某些游戏玩家的游戏活动情况
每一行是在某天使用某个设备登出之前登录并玩多个游戏(可能为0)的玩家的记录
请编写解决方案,描述每一个玩家首次登陆的设备名称
返回结果格式如以下示例:
示例 1:
输入:
Activity table:
+-----------+-----------+------------+--------------+
| player_id | device_id | event_date | games_played |
+-----------+-----------+------------+--------------+
| 1 | 2 | 2016-03-01 | 5 |
| 1 | 2 | 2016-05-02 | 6 |
| 2 | 3 | 2017-06-25 | 1 |
| 3 | 1 | 2016-03-02 | 0 |
| 3 | 4 | 2018-07-03 | 5 |
+-----------+-----------+------------+--------------+
输出:
+-----------+-----------+
| player_id | device_id |
+-----------+-----------+
| 1 | 2 |
| 2 | 3 |
| 3 | 1 |
+-----------+-----------+
在用pandas刷力扣的时候遇到了,这是一道分组聚合的题,我的思路是这样的:
import pandas as pd
def game_analysis(activity: pd.DataFrame) -> pd.DataFrame:
#将原数据集的event_date列分组后进行最小值聚合
activity['event_date']=activity.groupby('player_id').agg({'event_date':'min'})
#按行删除聚合后event_date列为空的数据
activity=activity.dropna(axis=0).reset_index(drop=True)
#返回要求的数据
return activity[['player_id','device_id']]
我不太明白这种聚合的方式为什么不正确,请各位解答一下,感激不尽