各位好,数据清洗真的要了老命了
目前数据框的ipc列,每个有多个值(图1),接下来要和多个目标ipc列表匹配(图2)。
有尝试先对这个列分割,但是会得到一个list或者一个向量,都不是我想要的,因为最终还要汇总到公司,还是想要原本的数据结构,不知道可以怎么操作呢,麻烦大家啦~
各位好,数据清洗真的要了老命了
目前数据框的ipc列,每个有多个值(图1),接下来要和多个目标ipc列表匹配(图2)。
有尝试先对这个列分割,但是会得到一个list或者一个向量,都不是我想要的,因为最终还要汇总到公司,还是想要原本的数据结构,不知道可以怎么操作呢,麻烦大家啦~
可以尝试用%in%判断和提取相应字段。参考代码:
d<-read.csv('rt1.csv',encoding='utf-8',sep=' ',header=F)
e<-read.csv('rt2.csv',encoding='utf-8',sep=' ',header=F)
#print(e)
c=c()
for (i in 1:length(e$V1)){
for (j in 1:length(d$V2))
{
if (e$V1[i] %in% unlist(strsplit(c(d$V2[j]),split="|",fixed=TRUE))){
c<-c(c,d$V1[j])
}
}
}
df<-data.frame('code'=e$V1,'name'=c)
print(df)
运行结果:
r$> source('r8.r')
code name
1 A62C27/00 d|b
2 A62C29/03 d|b
3 A62C31/05 d|b
4 B06C5/02 c|b
5 B06C11/10 c|b
6 B55C11/00 a|b
7 B55C1/12 a|b
8 F16L1/06 a|b
如有帮助,请点采纳。