关于#r语言#的问题：(svydesign)为什么在一个大的数据集中抽取了一个小数据集

fs_design <- svydesign(data = f.data, ids = ~SDMVPSU,

                       strata = ~SDMVSTRA,

```
                       nest = TRUE, 
```

                       weights = ~WTDRD1,

                       survey.lonely.psu = "adjust")

Error in (function (object, ...) : missing values in `id'

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

20条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
专家-赤兔[在线] 全栈领域优质创作者 2024-03-29 21:43
关注
获得0.45元问题酬金
引自免费微信小程序：皆我百晓生

在R语言中，svydesign()函数是用于构建复杂抽样设计的数据结构，它来自于"survey"包，主要用于处理具有权重、层(strata)、群聚(cluster)等特征的社会科学调查数据。您提供的代码片段正是创建这样一个设计对象的过程。

具体解释一下您代码中的各个参数含义：

data = f.data: 这里指定了要分析的数据集为f.data。即使这个数据集是从一个更大的数据集中抽取出来的子集，只要它包含了构建抽样设计所需的关键信息（如样本单位ID、层、权重等），就可以用来进行后续的复杂抽样分析。

ids = ~SDMVPSU: 这表示每个观测单元（或者说样本）的唯一标识符是变量SDMVPSU，通常对应于初级抽样单元（Primary Sampling Unit, PSU）。

strata = ~SDMVSTRA: 这里定义了抽样的层(strata)，即数据集按照SDMVSTRA这个变量被划分为了不同的层，在多阶段抽样设计中，同一层内的单元具有某种相似性，并且通常在每一层内部独立进行抽样。

nest = TRUE: 当设置为TRUE时，表示数据中可能存在嵌套结构，也就是说，某些PSU可能包含其他的PSU（比如家庭嵌套在社区中）。开启此选项后，函数会正确处理这种嵌套关系。

weights = ~WTDRD1: 指定样本权重变量为WTDRD1，这个权重反映了每个观测值在总体估计中的相对重要性，有助于得到无偏估计量。

survey.lonely.psu = "adjust": 在有些情况下，某一PSU可能仅包含一个观测值（称为“孤独的PSU”），这可能会导致标准误差估计不准确。通过设置此参数为"adjust"，可以采用某种调整方法来应对这一情况，从而提高估计的有效性。

总结来说，这段代码就是在从大型数据集中提取的小数据集上构造一个复杂的抽样设计，以便于利用survey包对带有权重、分层、群集等特点的数据进行精确统计推断。如果您在实际操作中有遇到特定问题或错误，可以根据上述解析检查您的数据是否满足相应的条件要求。
解决无用
评论打赏
分享
举报编辑记录

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

R语言 数据框随机抽样。 r语言
2020-04-17 16:30

回答 1 已采纳 R语言-随机数和抽样前言在Matlab、R或者S-PLUS等软件中做随机数模拟时，经过会遇到set.seed()这个函数。随机数的产生需要有一个随机的种子，因为用计算机产生的随机数是
R语言缺失值处理实例分析_社会指标调查数据2018 r语言数据分析有问必答
2021-11-21 15:05

回答 1 已采纳你现在遇到什么问题呢，请具体说明啊
SQL语句问题。一个数据库表抽取数据的问题 database sql
2022-08-08 06:32

回答 1 已采纳 select *,if(T_num=0,'0%',concat(ROUND((T_num-F_num)/T_num*100),'%')) from (select B,date_format(date
iris数据集_R语言数据分析与挖掘(第一章):数据预处理(3)——数据整理
2020-11-21 13:24

weixin_39723899的博客 1.数据合并我们在R语言基础语法教程中介绍了数据合并的一般方法，即利用函数cbind()和rbind()来进行合并，但这只是对数据进行简单的连接，且要求用于合并的数据集有相同的维数，否则R语言将会报错。在处理一些相对...
一个关于R的题目，求详细 r语言有问必答
2021-10-09 16:51

回答 2 已采纳 data<-read.table("C:/Users/lenovo/Desktop/试验作业2/data.csv",header=TRUE,sep=")length(new.data[,1])
用R语言写一段简单程式 r语言
2020-10-18 14:30

回答 1 已采纳你的第三行语句，打印data1可能会出现NA的情况，为什么会出现NA不清楚。下面是完整的代码，for语句中的就是取data2，可以参考下 ``` sum <- sample(1:10
在一定范围内选取7个数据 r语言
2023-02-06 21:04

回答 2 已采纳方案来自梦想橡皮擦狂飙组基于 GPT 编写的 “程秘” 可以使用R语言的sample()函数随机抽取7个数据，并使用cut()函数将一个固定范围划分为13个连续的小范围。下面是一个示例代码： #
2020语言与智能技术竞赛：事件抽取任务
2022-04-21 11:21

2020语言与智能技术竞赛：事件抽取任务2020语言与智能技术竞赛：事件抽取任务2020语言与智能技术竞赛：事件抽取任务2020语言与智能技术竞赛：事件抽取任务2020语言与智能技术竞赛：事件抽取任务2020语言与智能技术...
R语言如何只提取矩阵的偶数行 r语言有问必答
2021-10-29 11:51

回答 1 已采纳代码可这样写： X<-matrix(c(2,3,7,5,6,11,15,1,4,0,1,5,8,2,22,21,13,15,41,44),5,4,T) #print(X) res<-fu
想要写一个不放回抽取排序，同时想要用yield减少内存，但是有些问题 python
2022-02-08 17:48

回答 2 已采纳问题三太长了我不看了。至于问题1，2，当你传入2，你执行了两次check([1, 2]）,第一次确实删了一个(猜测你的choice函数来自random），第二次执行你又传进去个列表：check([1,
1.生成一个新变量lnwkearns,其取值为log(wkearns) 2.利用egen命令，生成标准化的wkearns变量，并命名为stdwkearns. 开发语言
2023-04-01 20:52

回答 2 已采纳基于Monster 组和GPT的调写： gen lnwkearns = ln(wkearns) egen stdwkearns = std(wkearns) xtile group = wkear
R语言构建xgboost模型：使用xgb.DMatrix保存、加载数据集、使用getinfo函数抽取xgb.DMatrix结构中的数据
2021-12-26 00:03

Data+Science+Insight的博客 R语言构建xgboost模型：使用xgb.DMatrix保存、加载数据集、使用getinfo函数抽取xgb.DMatrix结构中的数据目录 R语言构建xgboost模型：使用xgb.DMatrix保存、加载数据集、使用getinfo函数抽取xgb.DMatrix结构中的...
Java语言编写一个用户背单词程序 eclipse java 有问必答
2021-07-01 12:02

回答 2 已采纳 1.定义一个字符串数组，保存英文单词； 2.用Random随机一个数组下标，通过下标取出数组元素中的英文单词。 3.判断是否准确。
数据结构图谱构建与关系抽取数据集.rar
2019-11-11 10:57

本数据集主要提供对数据结构学科知识图谱的构建，主要包含500+数据结构方面的知识实体，9种关系，176000+示例，16000+实体对，已标注好3676个实体对关系。通过模型学习已标注的实体对来对未知实体对进行关系抽取，...
ChatIE：通过多轮问答问题实现实命名实体识别和关系事件的零样本信息抽取，并在NYT11-HRL等数据集上超过了全监督模型
2023-07-05 17:09

我们将零样本IE任务转变为一个两阶段框架的多轮问答问题（Chat IE）,并在三个IE任务中广泛评估了该框架：实体关系三元组抽取、命名实体识别和事件抽取。在两个语言的6个数据集上的实验结果表明，Chat IE取得了非常好...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
系统已结题 4月6日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 3月29日

悬赏问题

¥20 wireshark抓不到vlan
¥20 关于#stm32#的问题：需要指导自动酸碱滴定仪的原理图程序代码及仿真
¥20 设计一款异域新娘的视频相亲软件需要哪些技术支持
¥15 stata安慰剂检验作图但是真实值不出现在图上
¥15 c程序不知道为什么得不到结果
¥40 复杂的限制性的商函数处理
¥15 程序不包含适用于入口点的静态Main方法
¥15 素材场景中光线烘焙后灯光失效
¥15 请教一下各位，为什么我这个没有实现模拟点击
¥15 执行 virtuoso 命令后，界面没有，cadence 启动不起来

关于#r语言#的问题：(svydesign)为什么在一个大的数据集中抽取了一个小数据集

20条回答 默认 最新

问题事件

悬赏问题

20条回答默认最新