想问一下大家,FDR矫正后,p值差距很大怎么整,本来显著差异的基因有几万个,矫正完就几十个了,对基因组和基因分析的wilcoxon检验矫正的p值甚至一个显著差异的都没有。想请教一下,用inStrain计算出的breadth,coverage能不能进行过滤处理筛掉低丰度的数据

想问一下大家,FDR矫正后,p值差距很大怎么整,本来显著差异的基因有几万个,矫正完就几十个了,对基因组和基因分析的wilcoxon检验矫正的p值甚至一个显著差异的都没有。想请教一下,用inStrain计算出的breadth,coverage能不能进行过滤处理筛掉低丰度的数据

以下回复参考:皆我百晓生、券券喵儿等免费微信小程序作答:
根据你的描述,FDR矫正后p值差距很大,导致显著差异的基因数量大幅减少。这可能是由于数据中存在一些低丰度的数据,影响了p值的计算和矫正。为了解决这个问题,你可以考虑对基因组和基因分析的wilcoxon检验矫正的p值进行过滤处理,筛掉低丰度的数据。
在R语言中,你可以使用以下方法进行过滤处理:
首先,你需要确定一个合适的过滤阈值,用于筛选高丰度的数据。这个阈值可以根据你的数据特点和实验设计来确定。
使用inStrain计算出的breadth和coverage作为过滤条件。你可以根据inStrain的相关文档或文章来了解如何计算这些指标。
根据确定的过滤条件,删除掉coverage和breadth比较低的genome。
对过滤后的数据进行p值矫正,可以使用R语言中的相应函数进行FDR矫正。
以下是一个示例代码,用于根据coverage和breadth过滤数据并进行p值矫正:
# 假设你的数据存储在一个名为data的数据框中,其中包含coverage和breadth列
# 确定过滤阈值
coverage_threshold <- 10
breadth_threshold <- 5
# 根据过滤条件筛选数据
filtered_data <- data[data$coverage >= coverage_threshold & data$breadth >= breadth_threshold, ]
# 进行p值矫正
corrected_pvalues <- p.adjust(filtered_data$pvalue, method = "fdr")
# 将矫正后的p值添加到数据框中
filtered_data$corrected_pvalue <- corrected_pvalues
# 查看矫正后的显著差异基因数量
significant_genes <- filtered_data[filtered_data$corrected_pvalue < 0.05, ]
num_significant_genes <- nrow(significant_genes)
请根据你的实际情况修改代码中的变量名和阈值,以适应你的数据和需求。