屡屡跳舞 2022-04-23 22:07
浏览 31
已结题

用R语言处理CLDS2016的stata数据时,问卷中的项目在数据中找不到对应的变量

例如下图所示I9.25项目的数据在当年的stata文件中就找不到对应的变量:

img


我提取出所有变量中含有I9的变量名,结果如下,发现在I25、26、27都没有

img


在问卷其他部分也有类似的情况,缺失变量的原因可能在于项目的测量方式比较特殊,本题内部有许多未编码的子题。研究人员可能将其转换成了另外的变量名,但我浏览完一共一千五百多个变量名,也没有发现疑似的变量。从道理上讲,既然花功夫收集了数据,就不可能不加以利用,而且缺失的许多变量都具有非常丰富具体的数据内容,十分有研究价值,我想要的变量就在其中。
有无懂哥知道官方是怎么处理这些数据的?是没有公布(官方有提到未公布的部分数据,但不包含我发现缺失的这些)?还是我找到的数据不全(不太可能,缺失的变量有统一特点)?还是读取过程中出了问题(用read_dta读取的)?

  • 写回答

1条回答 默认 最新

  • 屡屡跳舞 2022-04-24 08:50
    关注

    好吧,就是没公开,需要特别申请

    本回答被题主选为最佳回答 , 对您是否有帮助呢?
    评论

    报告相同问题?

    问题事件

    • 系统已结题 5月2日
    • 已采纳回答 4月24日
    • 创建了问题 4月23日

    悬赏问题

    • ¥30 计算机网络子网划分路由模拟操作
    • ¥15 MATLAB的画图问题
    • ¥15 c语言用fopen_s成功打开文件之后闪退
    • ¥20 用C++完成,并且运用数组
    • ¥30 求解电力系统潮流计算结果不收敛问题
    • ¥15 某易易盾点选data解析逆向
    • ¥15 系统崩溃,关于订单的处理
    • ¥15 datax-web连接hive为数据源时发生报错,如何解决?
    • ¥15 plink在进行gwas分析时总读取不到表型
    • ¥20 数据结构与c语言的实践内容