海底深秀成堆 2020-05-05 10:38 采纳率: 100%
浏览 370
已采纳

duplicated函数导入外部表格报错

用duplicated去重的时候外部导入表格后,指定列会报错如:

指定外部Excel中name列查重

程序如下:

import pandas as pd
df = pd.read_excel(r'C:\Users\35059\Desktop\爬虫\333.xlsx')
print(df)
#验证重复数据
print(df.duplicated(subset=['name']))

报错:


Traceback (most recent call last):

  File "C:\Users\35059\Desktop\爬虫\数据案例处理.py", line 13, in <module>
    print(df.duplicated(subset=['name']))

  File "D:\ANACONDA\lib\site-packages\pandas\core\frame.py", line 4885, in duplicated
    raise KeyError(diff)

KeyError: Index(['name'], dtype='object')


但是在程序里自己敲个表格就不会报错:


from pandas import DataFrame
from pandas import Series
df = DataFrame({'age':Series(([1,5,6,5,5])),'name':Series(['ben','john','jerry','john','john'])})



print(df.duplicated('name'))

结果:

0    False
1    False
2    False
3     True
4     True
dtype: bool```
  • 写回答

1条回答 默认 最新

  • dabocaiqq 2020-05-05 12:30
    关注
    本回答被题主选为最佳回答 , 对您是否有帮助呢?
    评论

报告相同问题?

悬赏问题

  • ¥15 应该如何判断含间隙的曲柄摇杆机构,轴与轴承是否发生了碰撞?
  • ¥15 vue3+express部署到nginx
  • ¥20 搭建pt1000三线制高精度测温电路
  • ¥15 使用Jdk8自带的算法,和Jdk11自带的加密结果会一样吗,不一样的话有什么解决方案,Jdk不能升级的情况
  • ¥15 画两个图 python或R
  • ¥15 在线请求openmv与pixhawk 实现实时目标跟踪的具体通讯方法
  • ¥15 八路抢答器设计出现故障
  • ¥15 opencv 无法读取视频
  • ¥15 按键修改电子时钟,C51单片机
  • ¥60 Java中实现如何实现张量类,并用于图像处理(不运用其他科学计算库和图像处理库))