关于PSM结果的提问

各位专家们，我在用stata做psm，匹配后的结果如图，在匹配的过程中遇到如下问题：
总共367个样本，off support的样本为3个，但是_weight为.的样本有96个。
请问后续做分析是直接drop off support，还是需要drop _weight为.呢？急救。

写回答
好问题 0 提建议
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

3条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
紫雾凌寒新星创作者: 人工智能技术领域 2025-04-12 11:05
关注
让 “紫雾凌寒” 来帮你回答,本回答结合 DeepSeek

如果还有问题，请评论或点击头像私信，如果有帮助到您, 请关注、采纳、点赞

关键点分析：
- 总共367个样本，有3个样本处于off support（可能是超出了匹配可取值范围等情况），这相对较少，一般对整体分析影响较小。
- 但有96个样本_weight为缺失值（.），这是需要重点关注的问题，因为_weight在PSM分析中用于后续分析如加权回归等，如果大量缺失，会影响分析结果的准确性和可靠性。
解决方案：
- 首先要检查_weight缺失的原因。在PSM分析中，_weight是根据匹配算法计算出来的权重。缺失可能是由于匹配过程出现错误，比如数据不完整、协变量存在极端值影响了匹配效果等。
- 可以尝试重新检查数据，看是否存在数据录入错误，比如某些协变量的值是否正确。
- 也可以考虑调整匹配方法，不同的匹配方法对数据的要求和处理方式不同，可能某些方法能减少_weight缺失的情况。例如，常见的匹配方法有最近邻匹配、卡尺匹配等。
- 如果实在无法解决_weight缺失的问题，一种可能的处理方式是将_weight缺失的样本剔除，不过这样会减少样本量，可能会损失一定的信息。在Stata中可以使用drop if _weight==.命令来剔除。但这种方法要谨慎使用，因为样本量减少可能会影响统计功效。
- 关于后续做分析是否直接dr（倾向得分加权回归），如果_weight缺失严重，直接进行dr可能会得到不可靠的结果。建议先解决_weight缺失问题后再进行后续分析。
- 代码示例：
检查数据是否存在错误，比如查看协变量covariate1的值是否合理：list covariate1 if _weight==.
剔除_weight缺失的样本：drop if _weight==.
重新进行PSM匹配并计算权重：假设使用最近邻匹配，协变量为covariate1 covariate2
stata psmatch2 treat covariate1 covariate2, nnm

多种解决方案的优缺点：
- 检查数据：
优点：能直接发现数据本身的问题，如录入错误等，从根源上解决_weight缺失可能是由于数据问题导致的情况。
缺点：可能比较耗时，需要仔细检查每个协变量的数据值，而且不一定能找到明确的错误原因。
调整匹配方法：
优点：不同匹配方法可能适用于不同的数据特征，有可能通过调整方法减少_weight缺失。
缺点：不一定能完全解决问题，而且不同方法有不同的假设和适用场景，需要对各种方法有深入了解并进行尝试，增加了分析的复杂性。
剔除_weight缺失样本：
优点：简单直接，能快速解决_weight缺失对后续分析的影响。
缺点：减少了样本量，可能会损失部分信息，降低统计功效，尤其是在样本量本身不大的情况下（这里原始样本量367不算大），可能导致结果偏差。

总结：
- 对于PSM中_weight缺失的问题，要先深入检查原因，可尝试重新检查数据和调整匹配方法。如果实在无法解决，剔除缺失样本是一种可考虑的方法，但要谨慎权衡样本量减少带来的影响。在确保_weight问题得到妥善处理后，再进行后续如dr等分析，以保证分析结果的准确性和可靠性。

希望以上解答对您有所帮助。如果您有任何疑问，欢迎在评论区提出。
解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

【大厂AI实践】腾讯：QQ浏览器搜索中的智能问答技术
2025-02-27 11:30

吾辈亦有感ᵃⁱ的博客问答的核心是通过理解语言和运用知识来进行提问和回答。从应用角度看，由于人类有获取信息的需求和旺盛的好奇心，问答的场景无处不在；从研究角度看，问答是认知智能的前沿之一。问答在搜索场景的应用可以分为两类。...
一文通透让Meta恐慌的DeepSeek-V3：在MoE、GRPO、MLA基础上提出Multi-Token预测(含FP8训练详解)
2025-01-27 09:00

v_JULY_v的博客总之，搞AI、关注AI的这几天讨论deepseek很热烈——不管是V3还是R1 中国不缺顶级人才，也不缺大公司，但在AI前沿上，多年来的follow国外，造成了不小的思维定式，结果v3以llama 3.1 400B的1/10成本取得更好效果，...
学术新纪元：书匠策AI如何以智能之钥解锁毕业论文的“高阶玩法“？
2025-12-15 11:02

书匠策AI学术的博客 2.3 实证创新引擎：从"数据描述"到"因果发现"的跨越系统提供的实证分析工具包含：因果推断向导：支持PSM、DID、RDD等前沿方法（如用断点回归设计识别政策干预的阈值效应）稳健性检验库：自动生成多种检验方案...
某教育AI个性化学习价值评估模型：AI应用架构师拆解，如何量化学习效果提升
2025-09-04 01:20

AI大模型应用之禅的博客本文不仅覆盖因果推断、多模态数据融合、动态评估等前沿技术，更结合真实教育场景（K12数学个性化辅导、高等教育编程实训）的案例，提供可落地的“评估指标设计→算法选择→结果解释”全流程指南。无论你是教育AI...
【信息科学与工程学】【通信工程】第一百二十四篇中国企业网络通信和网络安全需求03 电力通信行业需求
2026-04-30 11:22

flyair_China的博客下面的条目（E-0001 至 E-0030）将详细分析电力系统各类业务/流量对通信网络的具体需求，并映射到5G、切片、OTN、电磁等具体技术领域。编号领域场景/业务需求名称推理过程与需求建模关键网络KPI与参数列表映射...
【信息科学与工程学】【人工智能】【知识工程】企业知识库管理与评估——第二篇
2026-01-11 02:33

flyair_China的博客隐性、经验性、情境性图结构+文档库隐性知识转化率、应用场景过程性知识流程性、操作性、时序性流程图+状态机流程完整性、执行效率元知识关于知识的知识元数据框架元数据完整性、质量控制二、公司结构...
【信息科学与工程学】【管理科学】第二十二篇市场与销售管理算法/模型核心方法——产品上市与组合管理类 (EM-MKT-PM)01
2026-02-22 19:34

flyair_China的博客 - 利益相关：产品总监（决策者）、产品经理（方案准备与数据输入）、市场分析师（提供市场准则数据）、技术负责人（提供技术可行性评估）。 - 工作任务：产品经理负责组织评估、收集判断数据、运行模型并汇报结果。...
【信息科学与工程学】【管理科学】第二十二篇市场与销售管理算法/模型核心方法——渠道管理与激励类 (EM-MKT-CH)01
2026-02-21 14:54

flyair_China的博客 D7: 技术赋能水平用什么技术实现？人工Excel、基础CRM/ERP、数据分析、AI预测、智能合约、IoT/数字孪生、元宇宙交互。 D8: 战略导向背后的战略意图？增长导向、利润导向、份额导向、生态锁定、风险分散、...
【信息科学与工程学】【市场体系】第十八篇销售策略模型和销售审计监督01
2026-03-08 12:13

flyair_China的博客：C(pi)=∑(Impactk×Probabilityk)，通过提问引导客户评估每个问题 pi带来的各方面影响（金钱、效率、风险等）Impactk及其发生可能性 Probabilityk。语言精确，包含“阶梯”、“区间”、“佣金率”、...
【信息科学与工程学】【运营科学】【家庭经营体系】第一篇家庭资源及利益/关系/情感经营解决方案01
2026-02-27 18:26

flyair_China的博客社会的每一种关系（雇佣、交易、合作、监管）、每一种流程（生产、物流、结算、评估）和每一种风险（市场、信用、法律、健康）都能在家庭内部或家庭与社会的接口处找到其简化或变形后的对应。职场（雇主/客户）、...
《我编程，我快乐——程序员职业规划之道》读书笔记
2017-05-08 22:34

faith的运维开发之路的博客 2. 密切关注外包公司还没有涉足的前沿技术或是国内市场的高需求的技术。 3.只会编程是不够的熟悉业务，从客户等多方角度去理解业务 4.做团队中最差的你身边的人对你有很大的影响，明智的选择圈子...
AI智能访谈：如何将用户研究从手工作坊升级为系统能力？
2025-12-22 10:39

YSinsight的博客它将深厚的咨询研究经验与前沿AI技术深度融合，为企业提供从研究设计、访谈执行到洞察输出的全链路智能解决方案。如果您希望将用户研究转化为企业可规模化执行的系统能力，欢迎了解悦数洞察「AI Interview」，开启...
【信息科学与工程学】【广告科学】第九篇广告算法01
2025-07-15 18:19

flyair_China的博客腾讯云网络基础设施采用分层架构设计，从资源隔离（cgroup）到全球专网，融合了多项自研技术。
【信息科学与工程学】【财务管理】第十九篇上市公司财务管理指南01
2025-08-11 18:34

flyair_China的博客六、前沿趋势与未来展望大型语言模型与财务分析应用：让LLM理解财务准则和税法条文，自动从合同、发票、财报附注中提取结构化信息，或生成财务分析报告，实现“自然语言到财务预测”的交互。联邦学习在集团财务...
【信息科学与工程学】【产品体系】第二十四篇产品线工程（PLE）和系统产品线工程的核心模型01
2025-07-14 08:37

flyair_China的博客模型/算法的逐步骤思考推理的数学方程式 - 【有向图】：决策点及其依赖构成一个有向图 G=(D,R)，节点 d∈D为决策点，边 (di,dj)∈R表示 di的结果影响 dj。可能为DAG，表示决策顺序。 - 【状态空间与转移】...
时间固定效应和个体固定效应的选择_互助问答第98期：固定效应与PSMDID相关问题...
2021-01-09 02:36

weixin_39569389的博客我想咨询一下关于双向(个体和时间)固定效应与PSM-DID两者各自优缺点的问题。1、双向(个体和时间)固定效应与PSM-DID各自有何优缺点？2、分别使用这两种方法进行估计时(双向固定效应的控制变量与PSM-DID的协变量完全...
ADOP 100G InfiniBand EDR：加速高性能计算的未来之路
2024-04-01 17:12

ADOP_Winners的博客随着100G InfiniBand EDR技术的持续演进与成熟，ADOP 100G EDR InfiniBand解决方案已然成为一个兼具高效能与稳定性的优选方案。ADOP的解决方案利用了InfiniBand技术，提供了每秒传输速率为100 Gbps的高吞吐量和低...
FPS综述：植物次生代谢物与微生物组互作研究进展
2021-03-26 00:38

刘永鑫Adam的博客关于在植物代谢组学实验中使用这些技术工具有许多优秀的综述评论(Lu et al., 2017; Tahir et al., 2019)和详细方案(Zhalnina et al., 2018)，这里不在赘述。需要注意的是，传统大多PSM的研究通常以植物组织的提取...
信息系统项目管理师笔记
2021-04-04 21:10

Ling912的博客嵌入式技术综合了计算机软硬件，传感器技术，集成电路技术，电子应用技术为一体的复杂技术。物联网包括三层：应用层，网络层，感知层。应用层是用户的接口，网络层是信息传递中枢，感知层是各种传感器。传感器是...
数据分析知识体系模型
2021-03-15 09:19

weixin_ry5219775的博客数据分析是指有针对性的收集、加工、整理数据，并采用统计、挖掘技术分析和解释数据。数据分析是为了提取有用信息和形成结论而对数据加以详细研究和概括总结的过程。 1 数据定义数据是客观事实,对于客观事物发生，...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 4月12日

关于PSM结果的提问

3条回答 默认 最新

问题事件

3条回答默认最新