2 luoshen li luoshen_li 于 2016.02.01 21:21 提问

pandas dataframe数据结构,想检查索引列中的数据是否唯一怎么检查

如题
pandas dataframe数据结构,想检查索引列中的数据是否唯一怎么检查
不知道pandas中有没有这样的函数

2个回答

devmiao
devmiao   Ds   Rxr 2016.02.01 23:45
qq_33399185
qq_33399185   2016.07.28 00:05

我目前还不清楚,不过有一个duplicated()函数可以做到,这个函数的作用返回的是布尔值,举个例子,比如第一次看到1,返回false,要是以后遇到1都返回True,然后可以把这个sum(),要是0就是唯一的。具体你可以查查官方文档,有一些参数也很重要。

Csdn user default icon
上传中...
上传图片
插入图片
准确详细的回答,更有利于被提问者采纳,从而获得C币。复制、灌水、广告等回答会被删除,是时候展现真正的技术了!
其他相关推荐
pandas带有重复索引操作
有的时候,可能会遇到表格中出现重复的索引,在操作重复索引的时候可能要注意一些问题。 一、判断索引是否重复 a、Series索引重复判断 s = Series([1,2,3,4,5],index=["a","a","b","b","c"]) print(s.index.is_unique) #False Series.index.is_unique为False表示索引重
如何判断DataFrame中是否有缺失值?
import pandas as pd import numpy as npdf = pd.DataFrame(np.random.randn(10,6)) # Make a few areas have NaN values df.iloc[1:3,1] = np.nan df.iloc[5,3] = np.nan df.iloc[7:9,5] = np.nandf.isnull().any()
python pandas 如何找到NaN、缺失值或者某些元素的索引名称以及位置,np.where的使用
我们在处理数据的时候,经常需要检查数据的质量,也需要知道出问题的数据在哪个位置。我找了很久,也尝试了很多办法,都没能找到一种非常直接的函数,本文所要介绍的是一种我认为比较方便的方法:np.where()我举个例子import pandas as pd import numpy as npdf = pd.DataFrame(np.arange(12).reshape(4,3), index=list(
Pandas 中根据列值,选取DataFrame数据,并获取行索引号列表
一、根据列条件,获取行索引号并转成列表#在dataframe中根据一定的条件,得到符合要求的某些行元素所在的位置import pandas as pd df = pd.DataFrame({'BoolCol': [1, 2, 3, 3, 4],'attr': [22, 33, 22, 44, 66]}, index=[10,20,30,40,50]) print(df) ...
pandas 判断某列状态变化
厚着脸皮,再写一篇~~~需求描述:如下列数据,第一列是id,第二列标识的是状态,但状态变化时,我需要统计出来保持该状态的其他列的一些数据如开始、结束时间,sum等等。虽然只有1020和1021两种状态,但是从1020变化到1021,这是一次变化,从1021变到1020这是第二次变化,所以要标识3种状态。假如直接按照这一列进行groupby,那么其他列的统计信息比如sum、mean等就会有问题,因为...
pandas将DataFrame的列变成行索引
pandas提供了set_index方法可以将DataFrame的列(多列)变成行索引,通过reset_index方法可以将层次化索引的级别会被转移到列里面。 1、DataFrame的set_index方法 data = pd.DataFrame(np.arange(1,10).reshape(3,3),index=["a","b","c"],columns=["A","B","C"]
pandas数据清洗,排序,索引设置,数据选取
此教程适合有pandas基础的童鞋来看,很多知识点会一笔带过,不做详细解释 Pandas数据格式 Series DataFrame:每个column就是一个Series基础属性shape,index,columns,values,dtypes,describe(),head(),tail() 统计属性Series: count(),value_counts(),前者是统计总数,后者统计各自valu
pandas的DataFrame删除列
df = pd.DataFrame(np.arange(12).reshape(3,4),columns=['A', 'B', 'C', 'D'])In [4]: df Out[4]: A B C D 0 0 1 2 3 1 4 5 6 7 2 8 9 10 11axis=1(按列方向操作)、inplace=True(修改完数据,在原数据上保存)一:...
Pandas详解十四之DataFrame对象的列和索引之间的转化
约定: import pandas as pd DataFrame对象的列和索引之间的转化 我们常常需要将DataFrame对象中的某列或某几列作为索引,或者将索引转化为对象的列。pandas提供了set_index()/reset_index() 来供我们使用。 一、列转化为索引 df1=pd.DataFrame({'X':range(5),'Y':rang...
pandas学习笔记-重新索引
pandas学习笔记-重新索引pandas对象的一个重要方法是reindex,其作用是创建一个适应新索引的新对象。以一个简单示例来说:import pandas as pdobj = pd.Series([4.5,7.2,-5.3,3.6],index=['d','b','a','c']) print obj结果 d 4.5 b 7.2 a -5.3 c 3.6 dtype: