想把两个csv中的日期的列提出年,做出新的一列,再把两个csv表格按照新做出的日期这列和ID号合并为一个表。
第一步,把表1和表2的USERDATE中的年提出来,做成新的一列,USERDAE_YEAR
表1 ADSXLIST
Phase ID RID SITEID VISCODE VISCODE2 USERDATE
ADNI1 2 2 107 m06 m06 2006/3/7
ADNI1 4930 2 107 m36 m36 2008/8/29
..... ......
ADNI1 4 5 107 m06 m06 2006/3/9
ADNI1 196 5 107 m12 m12 2006/9/6
表2 summary
Phase ID RID PTID SITEID VISCODE VISCODE2 USERDATE USERDATE2 EXAMDATE
ADNI1 2 2 011_S_0002 107 bl bl 2005/10/1 2005/9/29
ADNI1 336 2 011_S_0002 107 m06 m06 2006/4/27 2006/3/6
...
ADNI1 3136 4 022_S_0004 10 m18 m18 2007/6/22 2007/5/14
ADNI1 6060 4 022_S_0004 10 m36 m36 2008/12/1 2008/11/18
然后再把两个csv表格中,RID和USERDAE_YEAR相同的部分,组成一个新的csv表。
问题相关代码,请勿粘贴截图
import pandas as pd
import os
os.chdir(r'D:\BaiduNetdiskDownload\ADNI database\Diagnosis')
file1=pd.read_csv(r'ADSXLIST.csv')
file1['USERDAE_YEAR']=file1['USERDATE'].split(‘/’,1)[0]
print(file1['USERDAE_YEAR'])
运行结果及报错内容
0 0 2006
1 0 2006
...
4883 0 2006
这步就出错了。