qq_44505229 2023-09-13 19:54 采纳率: 50%
浏览 10
已结题

请教有下载过美国中老年调查( MIDUS)数据的朋友能否告知数据中该怎么区分不同类型的缺失数据?

个人下载了MIDUS数据中M1数据,使用的是r语言。根据文本描述,该数据的缺失值分为“拒绝回答”,“不适合本人”和“未填写问卷”,且三类数据都赋予了不同的值,但事实上,个人下载的. rda数据集用r打开后全是na值.
请问是否有朋友知道如何区分这些缺失数据或者说用什么软件的数据集包含这些赋值数据?

img

img

  • 写回答

12条回答 默认 最新

  • 专家-赤兔[在线] 优质创作者: 编程框架技术领域 2023-09-13 19:58
    关注
    获得0.60元问题酬金

    引用 皆我百晓生 小程序回复内容作答:

    根据描述,MIDUS数据集中的缺失值有三种类型: "拒绝回答","不适合本人"和"未填写问卷"。这些类型的缺失值在数据集中应该具有不同的数值表示。

    在R语言中,可以使用is.na()函数来判断数据是否为缺失值。对于下载的MIDUS数据集中的M1数据,如果所有的值都是NA,那可能是数据读取的问题。

    您可以尝试使用以下方法来确认数据是否包含了这些赋值数据:

    1. 检查数据集的摘要统计信息,看是否包含除了NA值以外的其他值。您可以使用summary()函数来获得数据的描述性统计信息。

    2. 检查数据集中特定变量的唯一值,以确定是否存在除了NA以外的其他值。您可以使用unique()函数来获取数据集中某个变量的所有唯一值。

    3. 检查数据集的文档或者相关的元数据文件,查看是否有特定的数值表示缺失值。这些文件可以提供关于数据集中缺失值表示的更详细的信息。

    如果以上方法都没有找到缺失值的赋值数据,建议尝试重新下载MIDUS数据集,并确保数据下载和读取的过程没有出错。另外,也可以参考MIDUS数据集的官方文档或咨询数据提供者,以获取更详细的信息。

    评论

报告相同问题?

问题事件

  • 系统已结题 9月21日
  • 修改了问题 9月13日
  • 创建了问题 9月13日