每一行为一个患者,列名为患者的检查指标,R如何根据行和列的缺失值比例来进行筛选,比如列变量要求保留缺失值<30%的列变量,行观测要求保留缺失值<40%的行观测,如何筛选出来成为一个新的数据框
列名为患者的检查指标,R如何根据行和列的缺失值比例来进行筛选,比如列变量要求保留缺失值<30%的列变量,行观测要求保留缺失值<40%的行观测,如何筛选出来成为一个新的数据框
- 写回答
- 好问题 0 提建议
- 追加酬金
- 关注问题
- 邀请回答
-
1条回答 默认 最新
- 「已注销」 2023-03-15 18:33关注
参考GPT和自己的思路:要筛选出符合条件的数据,可以使用R语言中的subset()函数。首先需要计算每一行和每一列的缺失值比例,然后运用subset()函数,将满足条件的行和列筛选出来,组成新的数据框。
下面是一个示例代码:#假设原始数据框为df
#计算每一列的缺失值比例
col_na <- colMeans(is.na(df))
#计算每一行的缺失值比例
row_na <- rowMeans(is.na(df))
#筛选出缺失值比例小于阈值的列和行
new_df <- subset(df, select = col_na < 0.3 & row_na < 0.4)其中,select参数的值是一个逻辑向量,可以将列和行缺失值比例小于阈值的部分筛选出来。最终,new_df就是符合要求的新数据框。
本回答被题主选为最佳回答 , 对您是否有帮助呢?解决 无用评论 打赏 举报
悬赏问题
- ¥15 想用@vueuse 把项目动态改成深色主题,localStorge里面的vueuse-color-scheme一开始就给我改成了dark,不知道什么原因(相关搜索:背景颜色)
- ¥20 OPENVPN连接问题
- ¥15 flask实现搜索框访问数据库
- ¥15 mrk3399刷完安卓11后投屏调试只能显示一个设备
- ¥20 白日门传奇少一个启动区服和启动服务器的快捷键,东西都是全的 , 他们说套一个出来就行了 但我就是弄不好,谁看看,
- ¥100 如何用js写一个游戏云存档
- ¥15 ansys fluent计算闪退
- ¥15 有关wireshark抓包的问题
- ¥15 需要写计算过程,不要写代码,求解答,数据都在图上
- ¥15 向数据表用newid方式插入GUID问题