菜鸟赫本 2022-10-31 17:48 采纳率: 82.1%
浏览 29
已结题

df.drop_duplicates无法数据去重

df.drop_duplicates无法数据去重

原数据:
id,prouductColor,content
1,黑,裤子
2,白,短袖
3,蓝,牛仔裤
1,黑,裤子

import pandas as pd

file= pd.read_csv('testdata.csv',encoding="gbk")
df = pd.DataFrame(file)

print(df['content'])

df.drop_duplicates(subset=['id','content'], keep='first', inplace=False)

运行结果及报错内容

运行后内容没有做到去重

  • 写回答

3条回答 默认 最新

  • GutsShinyHero 2022-11-09 21:01
    关注

    df=df.drop_duplicates(subset=['id','content'], keep='first', inplace=False)
    或者df.drop_duplicates(subset=['id','content'], keep='first', inplace=True)

    本回答被题主选为最佳回答 , 对您是否有帮助呢?
    评论
查看更多回答(2条)

报告相同问题?

问题事件

  • 系统已结题 4月22日
  • 已采纳回答 4月14日
  • 创建了问题 10月31日

悬赏问题

  • ¥15 求会做聚类,TCN的朋友有偿线上指导。以下是目前遇到的问题
  • ¥100 无网格伽辽金方法研究裂纹扩展的程序
  • ¥15 错误于library(org.Hs.eg.db): 不存在叫‘org.Hs.eg.db’这个名称的程序包,如何解决?
  • ¥60 求一个图片处理程序,要求将图像大小跟现实生活中的大小按比例联系起来的
  • ¥50 求一位精通京东相关开发的专家
  • ¥100 求懂行的大ge给小di解答下!
  • ¥15 pcl运行在qt msvc2019环境运行效率低于visual studio 2019
  • ¥15 MAUI,Zxing扫码,华为手机没反应。可提高悬赏
  • ¥15 python运行报错 ModuleNotFoundError: No module named 'torch'
  • ¥100 华为手机私有App后台保活