m0_47470548 2021-03-05 20:37 采纳率: 0%

TCGA合并GETx数据进行免疫lncRNA提取

问题如下：

下载TCGA肿瘤样本，但改数据中无正常组织，合并GETx数据进行免疫lncRNA提取，代码部分如下：

rm(list = ls())

library(limma)

corFilter=0.4

pvalueFilter=0.001

setwd("C:\\Users\\CXH\\Desktop\\120irlncRNA\\09.irRNA")

#读取lncRNA，并对数据进行处理

rt = read.table("lncRNA.txt", header=T, sep="\t", check.names=F)

rt=as.matrix(rt)

rownames(rt)=rt[,1]

exp=rt[,2:ncol(rt)]

dimnames=list(rownames(exp),colnames(exp))

data=matrix(as.numeric(as.matrix(exp)),nrow=nrow(exp),dimnames=dimnames)

data=avereps(data)

data=data[rowMeans(data)>0.5,]

#删掉正常样品

group=sapply(strsplit(colnames(data),"\\-"),"[",4)

class(group)

list(group)

group=sapply(strsplit(group,""), "[", 1)

group=gsub("2","1",group)

lncRNA=data[,group==0]

#读取免疫基因表达文件，并对数据进行处理

rt = read.table("immGeneExp.txt", header=T, sep="\t", check.names=F)

rt=as.matrix(rt)

rownames(rt)=rt[,1]

exp=rt[,2:ncol(rt)]

dimnames=list(rownames(exp),colnames(exp))

immuneGene=matrix(as.numeric(as.matrix(exp)),nrow=nrow(exp),dimnames=dimnames)

immuneGene=avereps(immuneGene)

immuneGene=immuneGene[rowMeans(immuneGene)>0.5,]

#删掉正常样品

group=sapply(strsplit(colnames(immuneGene),"\\-"),"[",4)

group=sapply(strsplit(group,""),"[",1)

group=gsub("2","1",group)

immuneGene=immuneGene[,group==0]

#相关性检验

outTab=data.frame()

for(i in row.names(lncRNA)){

if(sd(lncRNA[i,])>0.5){

for(j in row.names(immuneGene)){

x=as.numeric(lncRNA[i,])

y=as.numeric(immuneGene[j,])

corT=cor.test(x,y)

cor=corT$estimate

pvalue=corT$p.value

if((cor>corFilter) & (pvalue<pvalueFilter)){

outTab=rbind(outTab,cbind(immuneGene=j,lncRNA=i,cor,pvalue,Regulation="postive"))

}

if((cor< -corFilter) & (pvalue<pvalueFilter)){

outTab=rbind(outTab,cbind(immuneGene=j,lncRNA=i,cor,pvalue,Regulation="negative"))

}

但是运行相关性检验后，结果：Error in if ((cor > corFilter) & (pvalue < pvalueFilter)) { :

需要TRUE/FALSE值的地方不可以用缺少值

此外: Warning message:

In cor(x, y) : 标准差为零

反复排查，初步考虑删掉正常样品部分的代码需要修改，但怎么尝试都不行，请大神指点：

#删掉正常样品

group=sapply(strsplit(colnames(immuneGene),"\\-"),"[",4)

group=sapply(strsplit(group,""),"[",1)

group=gsub("2","1",group)

immuneGene=immuneGene[,group==0]

因为TCGA命名规律：TCGA-20-0987-01A

而GETx命名规律：GTEX-PWCY-1326-SM-48TCU

还请大神指点，谢谢！

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

1条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
lshen01 2023-03-16 14:09
关注
参考GPT和自己的思路：

看起来您的代码中有一些问题，可能导致出现缺少值的情况。具体来说：

在删掉正常样品部分的代码中，您使用了正则表达式“\-”来分割样本名，但是这个正则表达式不适用于GETx数据，因为GETx样本名中没有“-”字符。您需要使用"_"来分割GETx样本名。

在运行相关性检验的部分，您可能会遇到标准差为零的情况。这通常是由于数据中存在完全相同的样本或基因导致的。您可以检查一下您的数据，看看是否存在这种情况，并根据情况进行处理。

除此之外，我还建议您检查一下您的数据格式是否正确，特别是在读取文件的过程中。另外，您可以尝试使用一些调试工具（比如RStudio），以便更好地定位问题。
解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

TCGA临床数据cbind：see arg 36 r语言
2023-03-17 23:48

回答 5 已采纳参考GPT和自己的思路：这个错误提示说明你尝试使用cbind函数合并数据时，发现有些矩阵的行数不一致，无法进行合并。根据你的代码，我猜测这个问题可能是由于不同的xml文件中，数据的列数不同所导致的。
tcga数据预后分析 r语言数据库
2023-03-01 10:27

回答 1 已采纳一眼光俊，这个出结果是有条件的(pValue<0.01) & (roc$AUC[2]>0.68) & (pValueTest<0.05) & (rocTest$AUC[2]>0
tcga数据差异分析 r语言数据库
2023-02-28 18:13

回答 2 已采纳基于Monster 组和GPT的调写：在R中使用na.omit()函数时，它会删除包含缺失值的行并返回一个不包含缺失值的数据框。在您的代码中，您没有将结果赋值给新的对象，所以原始数据框被改变并且删除了
新版TCGA数据整理，通过R语言实现TCGA数据整理
2024-04-05 03:05

新版TCGA数据的整理，将TCGA单个转录组数据整理成列为患者，行为基因的矩阵。可以通过修改参数整理Count、FPKM、TPM数据，根据自己的需要进行选择。
tcga数据整理时一直显示找不到文件 r语言数据库
2023-02-27 16:39

回答 1 已采纳这个文件在报错路径下真实存在吗 a6a6b9c6-9db7-42b3-a09f-770b7e126fbb.rna_seq.augmented_star_gene_counts.tsv改成这样试下：pa
GEO数据基因表达量验证TCGA模型 r语言
2023-03-09 15:48

回答 1 已采纳小魔女参考了bing和GPT部分内容调写:使用GEO数据和TCGA模型筛选出的预后基因，可以对这些基因的表达量进行分析，以验证TCGA模型的准确性。可以通过比较GEO数据库和TCGA数据库中基因的表达
R语言下载完TCGA数据时，运行GDCprepare（）函数时，总是报C盘临时文件夹的一个错误 r语言有问必答
2021-04-10 23:16

回答 3 已采纳可能是下载的数不完整，或者数据存放路径有问题。建议先将dataPath这个部分代码注释掉，这样来写： BiocManager::install("TCGAbiolinks") library(TC
TCGA临床数据提取_perl提取tcga临床数据,perl读取临床数据报错
2021-05-04 14:18

自己编写程序，对TCGA的临床信息进行整理和提取，便于做生存分析
TCGA数据库建模后GEO数据库或ICGC数据库验证 r语言
2023-02-19 23:00

回答 8 已采纳该回答引用ChatGPT 有可能是由于两个数据集的差异性导致的。虽然两个数据集都是肝癌数据，但是不同的实验条件、处理方法、测序平台等都会导致基因表达的差异。在使用外部验证数据集时，可以进行以下步骤来
tcga预后森林图绘制 r语言数据库
2023-03-01 12:02

回答 2 已采纳基于Monster 组和GPT的调写：看起来是绘图时的一个坐标轴问题。由于 Cox 回归模型中某个变量可能具有无限的系数，因此在绘图过程中出现了这个问题。此外，在警告信息中，coxph 函数也提示您在
生信TCGA差异基因分析getDiffExpressedGenes报错 r语言有问必答
2021-11-14 22:48

回答 4 已采纳看仔细了，getDiffExpressedGenes这个函数里面，dataObject@RNASeq2GeneNorm可能是一个空的量，所以dim出来也都是0
tcga压缩包提取合并_TCGA转录本数据合并-R语言
2021-01-14 06:26

王希亚的博客 sample)[-1]){zanshi (zanshi,i,sep=",")} colnames(total_sort_sample) (strsplit(zanshi,",")) write.table(total_sort_sample,file="RNAmatrix.txt",sep="\t",row.names=F,quote=F) 因为是R语言自身的原因，速度...
使用R语言读取文件出现如下错误 r语言有问必答
2021-10-10 21:37

回答 2 已采纳提示错误是第6583行没有425个元素。可能是数据残缺，也可能是该行的分隔符有问题。检查一下原始数据，并作出相应修改。如有帮助，请点击采纳按钮给予采纳~~
TCGA临床数据提取
2019-04-12 18:32

自己编写程序，对TCGA的临床信息进行整理和提取，便于做生存分析
tcga压缩包提取合并_TCGA转录本数据合并
2021-01-14 06:26

weixin_39958025的博客 #!/usr/bin/perl -w use strict; use warnings; use Data::Dumper; use File::Basename; use JSON;... 由于样品还未排序，不好用于差异分析，所以需要根据样本类型进行排序：排序脚本 R语言合并脚本
tcga的symbol数据区分lncRNA和mRNA
2023-06-29 16:41

z2498249的博客帮家里的医生做个数据，她之前买过一个叫做“148cuproptosis.rar”的code。第7节的07.biotype的code biotype.pl 失效了，生成的两个文件lncRNA.txt和mRNA.txt都是空的。我不想去搞perl了。我用python重新写了一段。...
TCGA数据下载及全流程分析（更新中）
2021-01-20 11:09

一、GDCRNATools包下载首先下载R包 if (!requireNamespace...下载好之后运行，以COAD数据为例，下载： library(GDCRNATools) gdcRNADownload(project.id = TCGA-COADREAD, data.type = RNAseq, write.ma
新版TCGA不同癌种数据合并
2022-11-12 19:28

医学和生信笔记的博客很多文章对于TCGA中的一些癌症都是联合分析的，比如TCGA-COAD和TCGA-READ，首先是它们的疾病特点和治疗方式存在很多相似之处，同时这样做也...如果你是使用包下载的数据，那么它们的合并超级简单，直接cbind()即可！
Merge-putFilesToOneDir.zip_TCGA数据合并_mRNA merge.pl_mRNA_merge.pl_
2022-07-14 05:49

TCGA数据合并 Merge-putFilesToOneDir.zip
TCGA-blca数据集
2023-10-16 11:18

名称：TCGA-blca数据集简介：包含所有blca样本与汇总sheet。详情：同官方数据集，每个样本以独立文件形式储存，总目录下有所有样本的sheet汇总文件，有需要可以根据sheet文件汇总code。
没有解决我的问题, 去提问

悬赏问题

¥15 如何在scanpy上做差异基因和通路富集？
¥20 关于#硬件工程#的问题，请各位专家解答！
¥15 关于#matlab#的问题：期望的系统闭环传递函数为G(s)=wn^2/s^2+2¢wn+wn^2阻尼系数¢=0.707，使系统具有较小的超调量
¥15 FLUENT如何实现在堆积颗粒的上表面加载高斯热源
¥30 截图中的mathematics程序转换成matlab
¥15 动力学代码报错，维度不匹配
¥15 Power query添加列问题
¥50 Kubernetes&Fission&Eleasticsearch
¥15 報錯：Person is not mapped，如何解決？
¥15 c++头文件不能识别CDialog

TCGA合并GETx数据进行免疫lncRNA提取

1条回答 默认 最新

悬赏问题

1条回答默认最新