数据框使用布尔索引后,原本的行名1,2,3,4,5,6,结果中间第三行被过滤后,列名3也没有了,怎么从新给布尔索引后的数据框批量弄成航母行名1,2,3,4,5,6
2条回答 默认 最新
- joeyoung18 2021-07-30 12:57关注
根据题主的描述,应该是存在两个问题:
- 对数据框使用布尔切片。预期是过滤掉index = 3的数据,结果把columns = 3的数据也过滤了;
- 对已经索引后的数据框的index,重新批量修改为顺序数据。
根据上述对题主描述问题的重新定义,我尝试去建立了一个数据框来模拟题主的问题:
import numpy as np import pandas as pd data = {} a = [] for i in range(5): for row in range(5): a.append(round(np.random.rand(),2)) row += 1 data.update({i:a}) a = [] i += 1 df = pd.DataFrame(data) df #输出 0 1 2 3 4 0 0.57 0.74 0.49 0.38 0.93 1 0.18 0.97 0.23 0.19 0.29 2 0.49 0.51 0.23 0.95 0.42 3 0.05 0.85 0.26 0.13 0.96 4 0.68 0.99 0.75 0.29 0.27
首先是第一个问题:对数据框使用布尔切片。预期是过滤掉index = 3的数据,结果把columns = 3的数据也过滤了。
如果在数据框内尝试对索引或者字段进行布尔切片的话,一般使用的代码是df[df.index == 'target']或者df[df.columns == 'target']。
在本例子中,如果想达到题主的预期,使用的代码应该是这样的:df[df.index != 3] #输出 0 1 2 3 4 0 0.57 0.74 0.49 0.38 0.93 1 0.18 0.97 0.23 0.19 0.29 2 0.49 0.51 0.23 0.95 0.42 4 0.68 0.99 0.75 0.29 0.27
我不太清楚题主采用的是哪一种布尔切片方式,正常来说应该只会对索引或者字段单独进行了筛选,建议使用上述方式来进行切片。
然后是第二个问题:对已经索引后的数据框的index,重新批量修改为顺序数据。
思路是将索引后的结果进行保存后,使用reset_index()重置索引。
其中reset_index()里面有两个参数:drop = True,重置索引后不保留原来的索引编号;inplace = True,重置索引后直接将原本的浅拷贝保存在原数据框内。df2 = df[df.index != 3] df2.reset_index(drop = True,inplace = True) df2 #输出 0 1 2 3 4 0 0.57 0.74 0.49 0.38 0.93 1 0.18 0.97 0.23 0.19 0.29 2 0.49 0.51 0.23 0.95 0.42 3 0.68 0.99 0.75 0.29 0.27
在这里有一个小技巧:赋值新的数据框副本时,建议在代码后方增加.copy(deep = True),目的是避免在对新数据框进行处理时影响到原本的数据框。
由于pandas在处理数据时很多时候返回的都是浅拷贝,加上上述代码的话能避免比较多的问题。
最终的代码是这样的:df2 = df[df.index != 3].copy(deep = True) df2.reset_index(drop = True,inplace = True) df2
本回答被题主选为最佳回答 , 对您是否有帮助呢?解决 无用评论 打赏 举报
悬赏问题
- ¥20 西门子S7-Graph,S7-300
- ¥50 用易语言http 访问不了网页
- ¥50 safari浏览器fetch提交数据后数据丢失问题
- ¥15 matlab不知道怎么改,求解答!!
- ¥15 永磁直线电机的电流环pi调不出来
- ¥15 用stata实现聚类的代码
- ¥15 请问paddlehub能支持移动端开发吗?在Android studio上该如何部署?
- ¥20 docker里部署springboot项目,访问不到扬声器
- ¥15 netty整合springboot之后自动重连失效
- ¥15 悬赏!微信开发者工具报错,求帮改