weixin_42396142 2024-05-31 19:25 采纳率: 50%
浏览 40
已结题

RNA-seq仅提供normalized reads (DESeq2),如何进行后续分析

想从GEO数据库下载高通量测序数据RNA-Seq,简单做一篇生信分析。作者上传的数据不是原始的counts数据,只提供了一个normalized reads值 normalized reads (DESeq2),请问后续如何进行差异分析?是用limma直接分析?还是用DESeq2先转化成counts再进行分析?,如果想用这个数据做生信分析寻找目的基因,被认可吗?

  • 写回答

23条回答 默认 最新

  • 杨同学* 2024-06-05 14:08
    关注

    参考gpt
    在使用从GEO数据库下载的normalized reads (DESeq2)数据进行后续分析时,需要注意以下几点:

    1. 差异表达分析

    使用normalized reads (DESeq2)数据直接进行差异表达分析并不是标准做法,因为这些数据已经经过了归一化处理,并不是真正的原始counts数据。常用的方法是对原始counts数据进行归一化和差异表达分析,但是在没有原始counts数据的情况下,可以尝试以下几种方法:

    a. 使用Limma分析

    使用limma包分析normalized reads数据是一种常见的方法。limma包的voom函数可以将RNA-seq数据转换为适合线性建模的形式。虽然voom函数通常用于处理原始counts数据,但也可以用于处理已经归一化的数据。

    library(limma)
    
    # 假设normalized_data是你的归一化数据矩阵,rownames是基因,colnames是样本
    design <- model.matrix(~ 0 + factor(c(1, 1, 2, 2)))  # 示例设计矩阵
    colnames(design) <- c("Group1", "Group2")
    
    # 使用voom转换
    v <- voom(normalized_data, design)
    
    # 差异表达分析
    fit <- lmFit(v, design)
    contrast.matrix <- makeContrasts(Group2-Group1, levels=design)
    fit2 <- contrasts.fit(fit, contrast.matrix)
    fit2 <- eBayes(fit2)
    results <- topTable(fit2, adjust="fdr")
    

    b. 使用DESeq2的变体

    如果一定要使用DESeq2进行分析,可以尝试将normalized reads数据反归一化为类似counts的数据,但这种方法不太常见且容易引入误差。不推荐使用。

    2. 数据的认可度

    使用已经归一化的normalized reads数据进行分析在某些情况下是可以接受的,但在严格的科研环境中,分析原始counts数据通常更为理想。如果你计划发表论文或进行严格的生信分析,建议尽量获取原始counts数据。

    3. 寻找目的基因

    尽管使用normalized reads数据进行分析有其局限性,但你仍然可以用这些数据进行初步的探索性分析,寻找差异表达的目的基因。要确保分析结果的可靠性,可以考虑多种分析方法并交叉验证结果。

    4. 补充分析

    除了差异表达分析,你还可以进行其他类型的分析,例如基因集富集分析(GSEA),共表达网络分析(WGCNA)等,使用normalized reads数据是完全可以的。

    5. 数据可视化

    无论使用哪种方法进行分析,都可以用各种可视化手段来展示结果,例如火山图(volcano plot)、热图(heatmap)等。

    library(ggplot2)
    
    # 示例火山图
    ggplot(results, aes(x=logFC, y=-log10(P.Value))) +
      geom_point() +
      theme_minimal()
    

    总结

    虽然直接使用normalized reads数据进行差异表达分析并不理想,但在没有原始counts数据的情况下,limma包的voom方法是一种可行的选择。在发表论文或进行更严格的分析时,尽量获取原始counts数据以确保结果的可靠性和认可度。

    本回答被题主选为最佳回答 , 对您是否有帮助呢?
    评论
查看更多回答(22条)

报告相同问题?

问题事件

  • 系统已结题 6月14日
  • 已采纳回答 6月6日
  • 创建了问题 5月31日

悬赏问题

  • ¥15 Android Navigation: 某XDirections类不能自动生成
  • ¥20 C#上传XML格式数据
  • ¥15 elementui上传结合oss接口断点续传,现在只差停止上传和继续上传,各大精英看下
  • ¥100 单片机hardfaulr
  • ¥20 手机截图相片分辨率降低一半
  • ¥50 求一段sql语句,遇到小难题了,可以50米解决
  • ¥15 速求,对多种商品的购买力优化问题(用遗传算法、枚举法、粒子群算法、模拟退火算法等方法求解)
  • ¥100 速求!商品购买力最优化问题(用遗传算法求解,给出python代码)
  • ¥15 虚拟机检测,可以是封装好的DLL,可付费
  • ¥15 kafka无法正常启动(只启动了一瞬间会然后挂了)