我准备做一个“教育程度”和“收入水平”的回归模型。其中,“教育程度”变量(下图中的列)中的层次包括“未上学”到“研究生”,但用列联表呈现,发现各个教育程度层次在“没有工作的主要原因”变量(下图中的行)中都有“正在上学”和“毕业未工作”的状态,这样做分析误差可能会很大。我想将“教育程度”中所有层次的“正在上学”和“毕业未工作”的那部分人数清除,请问应该怎么做?
我试过用CSS2019$b2a[which(CSS2019$b2a == 4)] <- NA这个代码清除“没有工作的主要原因”里面的“正在上学”和“毕业未工作”这两个层次的人数,但我分析的变量是“教育程度”和“收入水平”,需要清除的是“教育程度”中满足“正在上学”和“毕业未工作”两个条件的人数。