PhaTracer 2018-05-15 02:42 采纳率: 22.2%
浏览 4161
已结题

python如何对dataframe中行去重?

RT,自己随便写了个,显示错误为
ValueError: Can only compare identically-labeled DataFrame objects

但总感觉思路都错了....请指教一下

import pandas as pd
from pandas import DataFrame
L=[]
file=open('F:\\FCD\\实验文本.txt')
a=file.readlines()
for line in a:
    L.append(line.split(','))
data=pd.DataFrame(L)

for i in range(len(data)):
    for u in range(len(data)):
        a=data[i:i+1]
        b=data[u:u+1]
        if u != i and a==b:
            data.drop(data.index[[i,i+1]],inplace=True)
  • 写回答

7条回答 默认 最新

  • zheshiweihe 2018-05-15 03:07
    关注

    import pandas as pd
    from pandas import DataFrame
    L=[]
    file=open('D:\FCD\1.txt')
    a=file.readlines()
    #print a
    for line in a:
    #print line
    #print line.strip('\n')
    L.append(line.strip('\n'))
    print L
    data=pd.DataFrame(L)
    print data
    print len(data)
    IsDuplicated = data.duplicated()

    print IsDuplicated

    print type(IsDuplicated)

    data = data.drop_duplicates()

    print data

    ##for i in range(len(data)):

    print "i:%d" % i

    for u in range(len(data)):

    print "u:%d" % u

    a=data[i:i+1]

    b=data[u:u+1]

    print "a:%s" % a

    print "b:%s" % b

    if u != i and a==b:

    data.drop(data.index[[i,i+1]],inplace=True)

    评论

报告相同问题?

悬赏问题

  • ¥15 fpga自动售货机数码管(相关搜索:数字时钟)
  • ¥20 Python安装cvxpy库出问题
  • ¥15 用前端向数据库插入数据,通过debug发现数据能走到后端,但是放行之后就会提示错误
  • ¥15 python天天向上类似问题,但没有清零
  • ¥30 3天&7天&&15天&销量如何统计同一行
  • ¥30 帮我写一段可以读取LD2450数据并计算距离的Arduino代码
  • ¥15 C#调用python代码(python带有库)
  • ¥15 活动选择题。最多可以参加几个项目?
  • ¥15 飞机曲面部件如机翼,壁板等具体的孔位模型
  • ¥15 vs2019中数据导出问题