如何用esttab输出STATA工具变量回归结果？

在使用 `esttab` 输出 Stata 工具变量回归（IV regression）结果时，一个常见问题是：**如何正确保存并输出 `ivregress` 或 `ivreg2` 的估计结果，使第一阶段和第二阶段的关键统计量（如弱工具变量检验、过度识别检验）一并显示在最终表格中？** 用户常发现 `esttab` 仅默认输出第二阶段系数，缺失 F 统计量、Cragg-Donald Wald F 统计量或 P 值等关键诊断信息。此外，当使用 `eststo` 存储 `ivreg2` 结果时，部分标量（如 `endogeneity test` 或 `underid test`）无法自动提取到 `esttab` 表格中，导致结果报告不完整。如何通过手动提取并添加 `estadd` 命令将这些统计量整合进 `esttab` 输出，是实现规范化学术呈现的技术难点。

写回答
好问题 0 提建议
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

1条回答默认最新

曲绿意 2025-09-21 08:02

关注

一、问题背景与核心挑战

在使用 Stata 进行工具变量回归（IV regression）分析时，研究者常采用 ivregress 或更强大的 ivreg2 命令进行两阶段最小二乘法（2SLS）估计。然而，在将结果输出为学术论文所需的表格格式时，esttab 通常仅默认展示第二阶段的系数和标准误，而忽略了第一阶段的关键诊断统计量，如弱工具变量检验的 F 统计量、Cragg-Donald Wald F 统计量、过度识别检验（Overidentification test）以及内生性检验（Endogeneity test）等。

这些缺失的信息对于评估 IV 模型的有效性至关重要。例如，若第一阶段 F 统计量小于 10，则可能存在“弱工具变量”问题；若模型存在多个工具变量，Sargan 或 Hansen J 检验可用于判断工具变量是否外生。因此，如何通过 eststo 存储模型，并利用 estadd 手动提取并附加这些标量至存储结果中，是实现完整、规范输出的技术关键。

二、Stata 中 IV 回归与结果存储机制解析

ivregress：Stata 官方命令，支持 2SLS、LIML 和 GMM，但返回的 e() 标量有限，不利于扩展输出。
ivreg2：由 Baum, Schaffer 和 Stillman 开发的增强型命令，提供丰富的诊断信息，包括：
- 第一阶段 F 统计量（F-statistic for first stage）
- Cragg-Donald Wald F 统计量（cd_f）
- Kleibergen-Paap rk Wald F 统计量（用于弱识别检验）
- Sargan/Hansen J 检验（overid）
- Endogeneity test（endogtest）
- Underidentification test（underid）
eststo 与 esttab：属于 estout 包，用于存储和导出回归结果，但默认不自动提取 ivreg2 的所有诊断统计量。

三、解决方案框架：从提取到整合

使用 ivreg2 执行工具变量回归并存储结果。
通过 return list 或 ereturn list 查看可用标量。
利用 estadd 将关键诊断值手动添加到 estimates store 中。
在 esttab 输出时通过 stats() 选项调用这些自定义统计量。

四、代码实现示例


// 安装必要包（若未安装）
ssc install estout, replace
ssc install ivreg2, replace

// 示例数据
sysuse auto, clear

// 工具变量回归：mpg 对 price，工具变量为 weight 和 length
ivreg2 price mpg (weight = length turn), robust first

// 存储模型
eststo model_iv: ivreg2 price mpg (weight = length turn), robust

// 提取并添加关键统计量
estadd scalar f_first = r(fstat)                   // 第一阶段 F 统计量
estadd scalar cd_f = r(cd_f)                       // Cragg-Donald F
estadd scalar p_cd = r(p_cd)                       // CD F 对应 P 值
estadd scalar overid = r(j)                        // Sargan J 统计量
estadd scalar p_overid = r(p_j)                    // Sargan P 值
estadd scalar endog = r(endog)                     // 内生性检验统计量
estadd scalar p_endog = r(p_endog)                 // 内生性检验 P 值
estadd scalar underid = r(weakid_stat)             // 不可识别检验统计量

// 输出包含所有诊断信息的表格
esttab model_iv ///
  using iv_results.txt, ///
  stats(N f_first cd_f p_cd overid p_overid endog p_endog underid, ///
        labels("Observations" "First-stage F" "CD F" "CD P-value" ///
               "Sargan J" "Sargan P" "Endogeneity Stat" "Endogeneity P" ///
               "Underid Stat")) ///
  b(%6.3f) se(%6.3f) star(* 0.1 ** 0.05 *** 0.01) ///
  title("IV Regression Results with Diagnostics") ///
  replace

五、关键统计量说明表

统计量名称	Stata 返回名	含义	临界参考值
First-stage F	r(fstat)	第一阶段联合显著性	>10 避免弱工具变量
Cragg-Donald F	r(cd_f)	多工具变量强度	>16.38（Stock-Yogo）
Sargan J	r(j)	过度识别检验	P > 0.05 接受外生性
Endogeneity Test	r(endog)	内生性检验	P < 0.05 支持内生
Underidentification Test	r(weakid_stat)	不可识别检验	应显著拒绝 H0
Kleibergen-Paap F	r(kp_f)	稳健弱识别检验	参考 KP 临界值
Hansen J	r(j_hans)	GMM 版本 Sargan	适用于异方差情形
Anderson LM	r(arub)	不可识别拉格朗日乘子检验	应显著
Weak ID F	r(weakid_fk)	Angrist-Pischke 弱识别检验	关注单个内生变量
LIML Estimator	r(liml_b)	有限信息最大似然估计值	与 2SLS 对比稳健性

六、流程图：IV 结果提取与输出全流程

graph TD A[运行 ivreg2] --> B{成功估计?} B -- 是 --> C[ereturn list 查看结果] C --> D[使用 eststo 存储模型] D --> E[通过 r() 或 e() 提取诊断统计量] E --> F[使用 estadd 添加标量] F --> G[调用 esttab 输出] G --> H[生成含诊断信息的 LaTeX/CSV 表格] B -- 否 --> I[检查工具变量有效性或模型设定]

本回答被题主选为最佳回答 , 对您是否有帮助呢?

报告相同问题？

关注问题

asdoc：Stata 结果输出又一利器！
2018-10-29 08:20

arlionn的博客攥写论文过程中，将统计和回归结果以及其他变量输出到 word 是重要一步，如何才能既美观又不耗费大量脑细胞改改改、调调调呢？ summarize、correlate、tabstat、cross-tabs、regressions、t-tests等等等等，这些...
论文党必备！用Stata+Word自动生成三线回归表（含标准化系数输出技巧）
2025-09-07 11:04

深海孤鲸134的博客本文为论文作者提供了一套完整的Stata自动化工作流，重点介绍如何使用esttab命令将多元线性回归结果高效输出为期刊标准的三线表至Word文档。文章详细讲解了从环境搭建、结果存储、表格深度定制到输出标准化系数...
stata_code_do
2021-03-22 09:07

4. **结果输出**：使用`display`命令打印结果，`estout`或`esttab`命令格式化输出结果到文本或表格。 5. **图形制作**：`graph`系列命令用于创建各种类型的图表，如散点图（`scatter`）、折线图（`line`）和箱形图...
Stata零基础，纯小白如何快速学会写一篇论文?
2025-10-13 10:21

数据科学作家的博客本文为零基础Stata学习者提供快速完成论文实证分析的实用指南。...4)使用esttab命令输出规范表格。推荐《Stata统计分析从入门到精通》等教材，提倡通过复现实证论文来学习，并善用help命令和在线社区解决问题。
Stata/SPSS实证研究稳健性检验的概念和原理是什么？有哪些注意要点？
2025-10-23 16:11

数据科学作家的博客稳健性检验通过变量替换、模型调整、样本筛选等方法验证研究结论的可靠性，强调核心结果应在不同设定下保持稳定。文章详细比较了Stata（命令行高效）和SPSS（菜单交互）的操作差异，并推荐了多本实用教材，包括...
【计量统计】Stata实战：计量经济学核心公式解析与案例应用
2025-11-13 06:05

Linux的博客文章以分析教育水平对工资的影响为例，手把手演示了从数据导入、模型构建到结果解读与假设检验的全过程，并介绍了如何通过加入控制变量和使用稳健标准误来提升估计的可靠性，帮助读者将抽象的计量理论转化为可操作的...
多项logistic回归系数解释_多元回归系数：我们都解释错了？
2020-12-23 05:02

大宝藏的博客连享会·推文专辑：Stata资源 | 数据处理 | Stata绘图 | Stata程序结果输出 | 回归分析 | 时间序列 | 面板数据 | 离散数据交乘调节 | DID | RDD | 因果推断 | SFA-TFP-DEA文本分析+爬虫 | 空...
stata半个小时入门篇_command pwcorr_a is unrecognized
2024-04-26 16:32

m0_61067876的博客 Stata具有易于使用的界面、强大的数据管理和分析功能、广泛的统计方法和模型、丰富的图形展示等优点，使得它成为研究生进行数据分析的重要工具之一。此外，Stata也是学术论文中常用的统计分析软件之一，因此熟练掌握...
2024年stata半个小时入门篇_command pwcorr_a is unrecognized(2)，Python高级工程师面试题及答案
2024-05-04 09:47

2401_84141219的博客不知道你们用的什么环境，我一般都是用的Python3.6环境和pycharm解释器，没有软件，或者没有资料，没人解答问题，都可以免费领取（包括今天的代码），过几天我还会做个视频教程出来，有需要也可以领取~给大家准备的...
macbook运行stata
2024-11-12 17:09

yoggie尤的博客随着 Mac 系统在学术界和科研领域的普及，越来越多的数据分析师和研究人员选择使用 MacBook Air 作为他们的主力工作机。而 Stata 作为一款功能强大的统计软件，因其易用性和高效性受到了广泛欢迎。然而，对于 ...
告别手动加星号！Stata中pwcorr_a命令的5个高效使用技巧（适合论文写作）
2025-09-23 09:36

stem5的博客本文详细介绍了Stata中pwcorr_a命令的5个高效使用技巧，帮助论文作者自动化生成带显著水平星号标记的相关性系数矩阵，彻底告别手动标注。内容涵盖自定义显著性标记、批量处理、与回归分析流程整合及表格美化导出，...
用Stata的DO文件自动化处理368个城市数据：从清洗到可视化完整流程
2025-10-26 11:12

脸先着地天使的博客本文详细介绍了如何利用Stata的DO文件实现368个城市数据的全流程自动化...通过编写脚本，从Excel或DTA文件导入数据，完成清洗、变量构建、统计分析，最终实现可视化与报告生成，极大提升了研究效率与结果的可复现性。
Stata实战：如何用描述性统计和可视化快速发现数据问题（附完整代码）
2025-08-30 04:33

Oil88的博客本文详细介绍了如何运用Stata进行数据分析，通过描述性统计和可视化工具快速诊断数据问题。文章提供了完整的代码示例，涵盖数据分布检验、组间差异分析、异常值识别及处理策略，旨在帮助研究者建立稳健的数据探索...
可重复性研究：如何保证你的研究结果可重现？
2020-05-13 16:45

arlionn的博客如下是一些基本建议：所有的操作 (包括: 数据处理、绘图、回归分析、结果输出等) 都要记录在 dofile 中，尽量不要手动处理每个项目 (每篇论文) 一个文件夹；文件分类存放，文件尽可能按照特定规则命名每天实时...
stata变量引用
2023-04-12 23:31

PD我是你的真爱粉的博客在stata中，他能通过字符串来引用变量(面向对象的编程语言是不行的(如py))下面这段代码可以至直接将第三行删除，第二行转为变量label。局域暂元 (local) ：只能存在于一次运行之中。全局暂元:能长期存在内存中。查找...
【金融实证】用Python+statsmodels复刻STATA经典操作：OLS回归与虚拟变量实战
2025-08-01 01:28

day7的博客本文为金融实证研究者提供了从STATA迁移到Python的实战指南，重点演示了如何使用Python的statsmodels库复刻STATA中的经典OLS回归与虚拟变量操作。文章通过对比两者在数据处理、模型封装和结果可视化方面的差异，详细...
Stata高级研讨班完整讲义与代码实战指南
2025-11-17 23:11

泓三宝的博客回顾一下我们走过的路：从一...从命令使用者，成长为能编写自定义程序的开发者；最终触及 Mata 这一高性能核心，解锁大规模计算能力。每一步，都是思维方式的升级。记住一句话：好的分析不是跑得多快，而是走得有多稳。
Python vs Stata vs SPSS：零基础小白如何选？3个真实案例告诉你哪种工具最适合你
2026-03-08 00:07

佐伊23的博客本文通过电商运营、学术研究和市场调研三个真实案例，对比分析了Python、Stata和SPSS三大工具的核心差异与适用场景。文章指出，选择的关键在于匹配具体目标、时间与学习耐性：SPSS适合快速产出报告的业务人员，Stata...
STATA零基础入门：7天掌握核心技能
2026-01-11 10:07

AgatePanther34的博客坚持每天2小时，按照"基础操作→单变量分析→双变量关系→回归模型"的路径循序渐进，七天就能完成从完全不懂到独立分析的蜕变。最让我惊喜的是部署功能，写完分析脚本后一键就能生成可分享的报告页面，同学之间互相...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
已采纳回答 10月23日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 9月21日