pandas怎么合并某字段有重复项的表？

怎么拼接成下图这样？

df表里的A列是有重复的，df拼接过来的C列的值，在重复的A值里面只出现一次，求解！！！

用merger实在想出了怎么弄，丢大佬帮帮忙，可以VXHB感谢

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

2条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
小P聊技术 2021-06-12 10:42
关注
pandas如何将相同ID的字符串进行合并：

OUTLINE：

问题描述
自己的解决方案
大神的更优化的解法
总结

问题描述

""" id value 1 A 1 B 1 C 2 D 2 E 2 F 变为： id value 1 [A,B,C] 2 [D,E,F] pandas怎么把上面的结构变为下面的形式？ """

自己的解决方案

import pandas as pd import numpy as np data = pd.DataFrame({'id':[1,1,1,2,2,2],'value':['A','B','C','D','E','F']}) data1 = np.array(data.groupby(['id']))#按照id进行分类 # 转变成array对象之后，可以根据data1[0][1]查看其结构 id_kinds = 2#id的种类，此例比如1、2共两种 all_value = [] for j in range(2): value = [] for i in data1[j][1]['value']: value.append(i) all_value.append(value) print(all_value) #再创建新的dataframe new_data = pd.DataFrame({'id':[1,2],'value':all_value}) print(new_data)

输出结果为：

id value 0 1 [A, B, C] 1 2 [D, E, F]

大神的更优化的解法

解法一：可以用sum方法，将字符串进行连接

import pandas as pd import numpy as np data = pd.DataFrame({'id':[1,1,1,2,2,2],'value':['A','B','C','D','E','F']}) data1 = data.groupby(by='id')['value'].sum()

此时的输出结果为：

id 1 ABC 2 DEF Name: value, dtype: object

但是还不是我们想要的，因为我们还需要在中间加入逗号分隔
① 我们可以先将原始数据的value都变成“,A”

data = pd.DataFrame({'id':[1,1,1,2,2,2],'value':['A','B','C','D','E','F']}) data['value'] = data['value'].apply(lambda x:','+ x)

② 然后，对其使用sum方法进行字符串相加

data1 = data.groupby(by='id').sum()

此时的输出结果为，value值之前多了“,”

id value 1 ,A,B,C 2 ,D,E,F

③ 最后，对该列使用apply函数，去除‘,’

data1['value'] = data1['value'].apply(lambda x :[x[1:]])

就得到了最终的结果：

id value 1 [A,B,C] 2 [D,E,F]

解法二：对分组之后的结果，直接使用apply函数
一行代码就搞定！

data1 = data.groupby(by='id').apply(lambda x:[','.join(x['value'])])

那为什么可以这么做呢？
首先需要剖析的是，groupby之后的数据结构是什么样的，它是由元组构成的（分组名，数据块），数据块也就是dataframe结构。使用以下方式可以查看groupby之后的对象：

for ID，group in group_df: print(ID) print(group)

apply函数中的x作用的即是数据块（dataframe），通过数据块取value那一行得到的是Series对象，于是可以使用join方法进行操作。

总结

sum方法不仅可以用于数值计算，还可用于对于一个Series对象而言的字符串相加

a = ['a','b'] c = pd.Series(a).sum()

apply函数非常灵活，不仅可以作用于一个Series对象，还可以作用于一个groupby之后的数据块

data['value'].apply(lambda x :*****) data.groupby(by='**').apply(lambda x :*****)

lambda匿名函数可以极大优化精简我们的代码，是一个非常灵活好用的函数，记住它！
本回答被题主选为最佳回答 , 对您是否有帮助呢?

解决 1
无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

查看更多回答(1条)

报告相同问题？

关注问题

python pandas DataFrame()合并数据的问题 python 数据分析
2022-05-08 22:00

回答 2 已采纳 pandas 提供了可以合并两张表的函数merge，带参数how="outer"是取来自左右的并集，匹配不到的话元素就会设为Null最后做个if判断就可再加一列总成绩 import pandas as
如何用python pandas按某列中字符长度等于18位的条件筛选出excel表中所有数据？ python
2019-03-11 22:13

回答 1 已采纳用str.len方法来获取长度： ``` import pandas as pd import numpy as np from pandas import DataFrame,Serie
pandas中先判断表头为空后自定义表头 python 有问必答
2021-09-04 21:43

回答 1 已采纳值错误：长度不匹配：期望轴有6个元素，新值有5个元素
【python pandas】合并文件并剔除重复数据
2023-05-15 11:24

陈晓明start的博客合并多个文件并剔除重复数据
python pandas如果同时改变多列位置 python 有问必答
2022-04-09 22:59

回答 2 已采纳可以用列名列表切片方法一次替换。示例代码如下： import pandas as pd df0=pd.DataFrame([['A','1月',1,100],['B','1月',2,300],['C
pandas方法concat合并多个csv文件的同时进行排序不成功 python
2021-12-17 18:36

回答 3 已采纳 import pandas as pd import numpy as np data ={'A': ['1,995,713', '1,996,214', '1,99
使用Pandas将两个表格合并，根据同样日期年和月以及姓名。 python
2021-06-13 19:36

回答 2 已采纳 pd. merge(a,b,left_on=["日期","姓名"],right_on=["日期","姓名"])
Pandas数据合并:如何指定列进行merge?
2023-04-24 13:42

devid008的博客在数据分析中,经常需要对来自不同数据源的表进行合并操作。Pandas提供了强大的merge方法实现表合并,我们可以通过指定columns进行指定列上的合并。
python中使用groupby后，运行成功，但并未实现合并，甚至数据还是DataFrame python 有问必答
2022-03-25 18:10

回答 3 已采纳写成这样：d=date.groupby('账卡号')['余额'].sum().to_frame(name='余额').reset_index()print(d)
Python Pandas数据透视后两个列名一样，且多列变成加粗的字体，保存表格时存在问题 python
2021-07-28 11:56

回答 1 已采纳 data_out['统计']=data_out['商品']data_out= pandas.pivot_table(data_out, index=['姓名', 'ID', '商品'], aggfun
如何使用Pandas解决下述问题? python 大数据
2022-07-16 11:16

回答 1 已采纳你想要的结果可能要在你上一步之上处理，你可以参考一下去重的方法，或者说分组聚合取第一条结果，希望对你有所帮助
Python 教学 | Pandas 表格字段类型精讲（含类型转换）
2023-07-13 16:26

企研数据的博客本期文章，我们将在字段类型这一话题上进行更加深入的探索，同时学习如何对数据字段做类型转换。
python-pandas-按指定列删除重复值
2022-09-11 18:44

zxhy0123的博客【代码】python-pandas-按指定列删除重复值。
Python 教学 | Pandas 数据合并（含目录文件合并案例）
2023-07-13 16:40

企研数据的博客本期文章我们就学习如何使用 Pandas 的数据合并函数。
python数据分析之pandas数据合并
2022-10-12 22:22

柳小葱的博客这一章节来介绍pandas中的DateFrame实现数据合并的操作，类似于SQL中的内连接、外连接的操作.
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
已结题（查看结题原因） 5月17日

悬赏问题

¥15 ansys fluent计算闪退
¥15 有关wireshark抓包的问题
¥15 Ubuntu20.04无法连接GitHub
¥15 需要写计算过程，不要写代码，求解答，数据都在图上
¥15 向数据表用newid方式插入GUID问题
¥15 multisim电路设计
¥20 用keil，写代码解决两个问题，用库函数
¥50 ID中开关量采样信号通道、以及程序流程的设计
¥15 U-Mamba/nnunetv2固定随机数种子
¥30 C++行情软件的tick数据如何高效的合成K线

pandas怎么合并某字段有重复项的表？

2条回答 默认 最新

问题事件

悬赏问题

2条回答默认最新