2301_76190088 2023-03-15 16:49 采纳率: 46.7%
浏览 12
已结题

列名为患者的检查指标,R如何根据行和列的缺失值比例来进行筛选,比如列变量要求保留缺失值<30%的列变量,行观测要求保留缺失值<40%的行观测,如何筛选出来成为一个新的数据框

每一行为一个患者,列名为患者的检查指标,R如何根据行和列的缺失值比例来进行筛选,比如列变量要求保留缺失值<30%的列变量,行观测要求保留缺失值<40%的行观测,如何筛选出来成为一个新的数据框

  • 写回答

1条回答 默认 最新

  • 「已注销」 2023-03-15 18:33
    关注

    参考GPT和自己的思路:要筛选出符合条件的数据,可以使用R语言中的subset()函数。首先需要计算每一行和每一列的缺失值比例,然后运用subset()函数,将满足条件的行和列筛选出来,组成新的数据框。
    下面是一个示例代码:

    #假设原始数据框为df
    #计算每一列的缺失值比例
    col_na <- colMeans(is.na(df))
    #计算每一行的缺失值比例
    row_na <- rowMeans(is.na(df))
    #筛选出缺失值比例小于阈值的列和行
    new_df <- subset(df, select = col_na < 0.3 & row_na < 0.4)

    其中,select参数的值是一个逻辑向量,可以将列和行缺失值比例小于阈值的部分筛选出来。最终,new_df就是符合要求的新数据框。

    本回答被题主选为最佳回答 , 对您是否有帮助呢?
    评论

报告相同问题?

问题事件

  • 系统已结题 3月28日
  • 已采纳回答 3月20日
  • 创建了问题 3月15日

悬赏问题

  • ¥15 想用@vueuse 把项目动态改成深色主题,localStorge里面的vueuse-color-scheme一开始就给我改成了dark,不知道什么原因(相关搜索:背景颜色)
  • ¥20 OPENVPN连接问题
  • ¥15 flask实现搜索框访问数据库
  • ¥15 mrk3399刷完安卓11后投屏调试只能显示一个设备
  • ¥20 白日门传奇少一个启动区服和启动服务器的快捷键,东西都是全的 , 他们说套一个出来就行了 但我就是弄不好,谁看看,
  • ¥100 如何用js写一个游戏云存档
  • ¥15 ansys fluent计算闪退
  • ¥15 有关wireshark抓包的问题
  • ¥15 需要写计算过程,不要写代码,求解答,数据都在图上
  • ¥15 向数据表用newid方式插入GUID问题