m0_56454923 2024-03-27 00:32 采纳率: 33.3%
浏览 5

什么时候该用fpkm什么时候该用count

想问一下对胶质瘤做预后模型,首先对TCGA与GTEX联合分析差异基因,再对筛选的差异基因先进行单因素回归分析后,再进行lasso回归,最后建立coxph,请问该流程下应该下载fpkm数据还是count数据

  • 写回答

1条回答 默认 最新

  • 码农阿豪@新空间代码工作室 Java领域优质创作者 2024-03-27 00:33
    关注
    让阿豪来帮你解答,本回答参考chatgpt3.5编写提供,如果还有疑问可以评论或留言
    对胶质瘤的预后模型建立需要进行基因表达分析,并筛选差异基因。对于基因表达数据,常见的有fpkm和count两种形式。fpkm是以每百万个reads为单位来衡量基因表达量的,适用于RNA-seq数据,而count是计数形式的,适用于原始的测序数据。 在上述流程中,需要使用的是基因表达量数据,因为需要分析差异基因。一般来说,基因表达量的精准度越高,得到的差异基因也更加可靠。因此,建议下载fpkm数据进行分析。同时,需要注意的是不同实验的数据来源可能不同,需要对数据进行归一化处理,以消除批次效应和其他非生物学因素的影响。常见的归一化方法包括TMM、DESeq、edgeR等。以下是一个基于TCGA和GTEX数据,用于分析胶质瘤的差异基因的R代码示例:
    # load data
    library(TCGAbiolinks)
    library(SummarizedExperiment)
    query <- GDCquery(project = "TCGA-GBM", data.category = "Transcriptome Profiling", 
                       data.type = "Gene Expression Quantification",
                       workflow.type = "HTSeq - FPKM")
    GDCdownload(query = query)
    data <- GDCprepare(query = query, save = TRUE)
    # normalize data
    library(edgeR)
    data <- DGEList(counts = assay(data), group = as.factor(colData(data)$project_id))
    data <- calcNormFactors(data)
    data <- estimateDisp(data)
    fit <- glmQLFit(data)
    qlf <- glmQLFTest(fit, coef = 2)
    # screen differentially expressed genes
    dgelist <- topTags(qlf, n = Inf, p.value = 0.05)$genes
    genes <- rownames(dgelist)
    data_dge <- data[genes,]
    # perform lasso regression
    library(glmnet)
    x <- as.matrix(t(assay(data_dge)))
    y <- colData(data_dge)$days_to_death
    fit.lasso <- glmnet(x, y, alpha = 1, standardize = TRUE)
    # build CoxPH model
    fit.cox <- coxph(Surv(time = colData(data_dge)$days_to_death, 
                          event = colData(data_dge)$vital_status) ~ data_dge)
    summary(fit.cox)
    
    评论

报告相同问题?

问题事件

  • 创建了问题 3月27日

悬赏问题

  • ¥15 webhook无法验证负载
  • ¥15 Flutter sdk 更新到3.24.0后运行flutter run --release 报错
  • ¥15 装win10系统自带的锐炫控制面板可以删除吗,里面有虚拟摄像头, 人脸识别会造成干扰
  • ¥15 模块化生产的路径规划哪种算法更合适?
  • ¥15 如何在animate html5文档任意位置实现文本输入功能?
  • ¥15 电机正反转电路设计中,mos管的关断问题,求原因。
  • ¥15 关于#sql#的问题:怎么找出所有同时多张有效保单的车架号
  • ¥15 KFC账号下单提示拒绝操作
  • ¥20 HC32F460串口发送仅能接到一个数据
  • ¥15 求解答一下是否可以修改一个软件运行时生成的文件内部内置的文件创建时间?