孟德尔随机化筛选完工具变量后进行MR分析少两个工具变量，是什么问题？

PATH<-"D:\\Mendelian Randomization"
setwd(PATH)
library(ggplot2)
library(plyr)
library(data.table)
library(devtools)
library(MendelianRandomization)
library(TwoSampleMR)
EXP<-data.table::fread("D:/Mendelian Randomization/alopecia/AGA/finngen_R9_L12_ALOPECANDRO.gz")
EXP1<-data.frame(EXP)
head(EXP1)
colnames(EXP1)[c(4,3,5,7,9,10,11)]<-c("effect_allele.exposure","other_allele.exposure","SNP","pval.exposure","beta.exposure","se.exposure","eaf.exposure")
EXP1$id.exposure<-"AGA"
EXP1$exposure<-"AGA"
EXP1$samplesize.exposure<-201214
head(EXP1,6)
EXP1_IV<-subset(EXP1,pval.exposure<5e-05)
EXP1_IV<-clump_data(EXP1_IV,clump_kb = 10000,clump_r2 = 0.001,pop = "EUR")
OUT1<-extract_outcome_data(snps=EXP1_IV$SNP,outcomes = "ukb-b-19732*",proxies = T,maf_threshold = 0.01,access_token = NULL)
OUT1<-OUT1[!duplicated(OUT1$SNP),]
OUT1$id.outcome<-"Hypothyroidism"
OUT1$outcome<-"Hypothyroidism"
head(OUT1)
data_h<-harmonise_data(exposure_dat = EXP1_IV,outcome_dat = OUT1,action = 2)

library(phenoscanner)
dim(data_h)[1]
PhenoScan=phenoscanner(snpquery = data_h$SNP[1:25],pvalue = 5e-08)
write.csv(PhenoScan$results,file="PhenoScan.csv")
write.table(data_h$SNP,"SNP.txt",quote = F,row.names = F)
SNP<-read.table("SNP.txt",header = T)
data_h_SNP<-merge(SNP,data_h,by="SNP",all=F)
data_h_SNP_steiger<-steiger_filtering(data_h_SNP)
data_h_SNP_steiger<-subset(data_h_SNP_steiger,steiger_dir==TRUE)
data_h_SNP_steiger<-data_h_SNP_steiger[!duplicated(data_h_SNP_steiger$SNP),]
这一步结束后应该是25个工具变量
mr<-mr(data_h_SNP_steiger)
但这一步实际进行的确是23个工具变量，这到底是什么原因呢？

写回答
好问题 0 提建议
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

4条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
GISer Liu 2024-02-18 16:36
关注
该回答引用自GPT-3.5,由博主GIS_Liu编写：

问题的关键在于理解为什么在进行 Mendelian Randomization (MR) 分析时少了两个工具变量。通过审查提供的代码，可以进行如下分析和解决：

数据处理过程可能存在问题：在代码中，你进行了一系列数据处理步骤，如从数据集中提取工具变量、使用 PhenoScanner 进行数据筛选、合并数据等。在这些步骤中可能存在潜在的错误，导致最终得到的工具变量数量不符合预期。

数据筛选与合并过程中可能存在重复值或错误：在数据筛选和合并过程中，可能由于数据格式不一致、重复值、合并键错误等问题导致数据处理结果不正确。建议检查数据处理过程中的每一步，确保数据处理的准确性。

Steiger 测试过程可能影响了工具变量的数量：你使用了 steiger_filtering 函数进行 Steiger 测试，该过程可能导致部分工具变量被过滤掉。需要检查 Steiger 测试的参数设置以及测试结果，确保不会意外丢失工具变量。

查看数据处理过程中的中间结果：建议在每个数据处理步骤后输出中间结果，以便检查数据处理的正确性。可以输出工具变量的数量、数据合并结果等，以便定位问题所在。

调试代码中可能存在的错误：如果以上步骤都没有找到问题，可以尝试逐步调试代码，检查每一步的执行结果，以确定哪一步出现了问题。

针对以上分析，可以按照以下步骤进行解决：

逐步检查数据处理过程中的每一步，确保数据处理的正确性。
检查 Steiger 测试的参数设置以及测试结果，确保不会意外丢失工具变量。
输出中间结果，检查工具变量的数量和数据合并结果，定位问题所在。
如仍然无法解决，可以尝试调试代码，逐步排查错误。

通过以上方法，应该能够找到并解决代码中缺少工具变量的问题。

如果该回答解决了您的问题，请采纳！如果没有，请详述问题所在！
解决 1
无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

孟德尔随机化（一）| 随处可见的孟德尔随机化到底是什么？
2024-02-06 23:18

生信小白要知道的博客近来咱们的各大群中，经常有小伙伴们会问到孟德尔随机化相关的问题，鉴于它的出现频率过高，咱们就不得不来唠唠喽！
无需编程技能：医学生也能轻松进行孟德尔随机化分析的网页工具
2024-09-18 13:35

御风之的博客 孟德尔随机化（Mendelian Randomization, MR）分析作为一种新兴的统计方法，利用遗传变异作为自然实验的工具，为我们提供了一种评估因果关系的新途径。然而，MR分析的复杂性常常让没有编程背景的医学生望而却步。...
微信公众号：孟德尔随机化 MR入门基础-简明教程-工具变量-暴露
2023-11-22 11:33

生信小博士的博客 孟德尔随机化的核心其实是利用了孟德尔第二定律，也就是自由组合规律(law of independent assortment），当具有两对（或更多对）相对性状的亲本进行杂交，在子一代产生配子时，在等位基因分离的同时，非同源染色体上...
R语言：孟德尔随机化中去除弱工具变量的错误问题解决方法
2024-04-01 17:27

R_bailu的博客是"gutMR06.SNP2eaf.R"程序包里面代码有问题，正确的应是“webOtherAllele”，NP获取eaf值(效应位点的频率)时，脚本source("gutMR06.SNP2eaf.R")成了“web0therA1lele”，注意把“0”改成“O”，把“1”改成“l”。...
孟德尔随机化MR：原理和应用
2025-07-19 10:33

Omics Pro的博客 孟德尔随机化（Mendelian randomization，MR）是工具变量（Instrumental variable，IV）分析的一种应用，旨在非实验性数据中检验因果假设。在MR分析中，利用遗传变异（通常是单核苷酸多态性SNP）作为潜在风险因素的...
孟德尔随机化——如何选择工具变量
2022-05-26 09:42

野柚子__的博客从零开始了解孟德尔随机中工具变量的选择
全代码分享｜R语言孟德尔随机化怎么做？TwoSampleMR包MR一套标准流程
2024-03-04 11:28

MultiRibo的博客 孟德尔随机化(，MR)是一种利用基因变异作为工具变量来评估暴露与结果之间因果关系的统计方法。它基于这样的原理：基因变异是在出生前就随机分配给个体的，类似于在随机对照试验中随机分配治疗，因此可以帮助区分因果...
R语言孟德尔随机化教程[项目源码]
2026-03-30 06:22

R语言中的孟德尔随机化分析不仅仅局限于TwoSampleMR包，还有其他的R包如MendelianRandomization等，也提供了进行MR分析的函数和工具。这些工具的开发和应用，极大地推动了遗传流行病学和因果推断研究的发展。在...
【孟德尔随机】MR分析与共病分析的完美结合，仅用两张图发一区文章不是梦！
2025-08-06 15:55

全优统计的博客这个团队的MR研究实锤了！他们发现遗传性听力问题真的会增加得痴呆的风险，还会让人变"笨"。研究还发现，不同类型的听力问题会导致不同种类的痴呆，而且可能是通过让人变得孤独、抑郁，或者让大脑某些区域（特别是...
R数据分析：孟德尔随机化实操
2024-11-07 18:36

wyhua2008的博客好多同学询问孟德尔随机化的问题，我再来尝试着梳理一遍，希望对大家有所帮助，首先看下图1分钟，盯着看将下图印在脑海中：上图是工具变量（不知道工具变量请翻之前的文章）的模式图，明确一个点：我们做孟德尔的...
孟德尔随机化方法与应用[可运行源码]
2025-11-12 16:37

TwoSampleMR包是R语言环境下用于执行孟德尔随机化分析的一个工具，它允许用户更高效地处理遗传数据，进行SNP的选择和效应值的提取。利用这个包，研究者能够对大量遗传变异进行分析，从而使得研究结论更加稳健可靠。...
孟德尔随机化中的无效工具变量检验
2019-12-23 19:30

生信修炼手册的博客欢迎关注”生信修炼手册”!两样本的孟德尔随机化研究只需要基于gwas summary数据，就可以研究暴露因素和结局变量之间的因果关系，是最广泛使用的研究手段之一。要保证MR研究结果的可靠...
用于孟德尔随机化分析的R包TwoSampleMR
2024-04-20 09:01

孟德尔随机化（Mendelian Randomization，简称MR）是一种利用遗传变异作为工具变量来评估因果效应的统计方法。在流行病学研究中，这种方法可以帮助科学家们探讨生活方式、环境因素与疾病之间的潜在因果关系，避免...
孟德尔随机化、R语言，报错，如何解决？
2024-07-30 14:21

bug菌¹的博客解决方案如下是上述问题的解决方案，仅供参考： 孟德尔随机化（Mendelian randomization, MR）是一种利用遗传变异作为工具变量来评估因果关系的统计方法。在 R 语言中，进行 MR 分析通常涉及到使用特定的...
孟德尔随机化分析和GWAS分析有什么区别？
2024-09-14 12:30

育种数据分析之放飞自我的博客对于GWAS分析，从原理到实操，我是比较熟悉的，还编写了一本GWAS分析教程V6版，在学习孟德尔随机化分析的过程中，我发现GWAS的结果是MR的输入，所以关系应该是现有GWAS分析，再有MR分析。GWAS: GWAS的主要目标是识别...
看完不会来揍我 | 孟德尔随机化（二）—— 代码实操 | 附代码注释 + 结果解读
2024-04-15 17:23

生信小白要知道的博客最近真的是超超超超超超超级多的小伙伴们在咨询孟德尔随机化相关的问题和课程，意想不到的那种多！那我怎么办嘞！整呗！主打的就是一个宠粉！
【孟德尔】赢麻了？孟德尔随机化+转录组分析助力一区6分，生信也能这么强！
2025-08-13 14:54

全优统计的博客结合SMR、HEIDI和共定位分析，深入探讨免疫细胞特异性基因与乳腺癌的因果关系，并通过GEO、TCGA和GTEx等数据库增强研究可靠性。它为基因靶向药物开发提供了潜在靶点，有助于设计更精准的治疗方案，同时通过跨数据库...
【亲测免费】 MRlap: 基于R的两样本孟德尔随机化分析工具
2024-09-12 07:37

贾嘉月Kirstyn的博客 **MRlap** 是一个专为进行两样本孟德尔随机化（MR）分析而设计的R包。该工具特别适用于处理可能存在重叠样本的基因组广泛关联研究（GWAS）数据。MR分析旨在利用遗传变异作为自然实验来探究暴露因素与疾病结局之间的...
孟德尔随机化方法汇总[项目源码]
2026-01-02 08:08

孟德尔随机化方法是一种以孟德尔遗传规律为基础，利用遗传变异作为工具变量来分析暴露因素与结果之间的因果关系的研究方法。这一方法的核心在于，遗传变异通常被认为是随机分配的，不受混杂因素的影响，因此可以用来...
生信分析服务MR孟德尔随机化单细胞测序转录组数据分析网络药理学
2025-04-05 10:42

matlabgoodboy的博客以下从技术逻辑、应用场景和服务流程三个维度展开说明：一、技术逻辑与优势 孟德尔随机化（MR）核心作用：通过遗传变异作为工具变量，推断暴露因素（如肠道菌群、代谢物）与疾病之间的因果关系，减少混杂因素干扰...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 2月18日

孟德尔随机化筛选完工具变量后进行MR分析少两个工具变量，是什么问题？

4条回答 默认 最新

问题事件

4条回答默认最新