数模比赛提供的数据集为.psv格式的,但是无论是用改为csv后缀,用excel打开还是用记事本打开等方法都无法正常获取文件内的数据,是一堆NaN的乱码(据说是浮点溢出)。有人说可以用Microsoft Access解决,也有人说要使用|分隔符,但不太会操作。请问如何解决?
1条回答 默认 最新
关注试试这段python代码
# 替换成自己的文件地址 data=r'C:\Users\training.psv' Coursedata=[] Coursedataform=[] dic={} with open(data,'r',newline="") as psvfile: for line in psvfile.readlines(): Coursedata.append(line[0:len(line)-1])#去掉最后的换行符 Coursedata = Coursedata[1:]#去掉抬头第一行,只保留数据 print(len(Coursedata)) for i in Coursedata: Coursedataform.append(i.split("|"))#psv文件使用|符号分割数据本回答被题主选为最佳回答 , 对您是否有帮助呢?评论 打赏 举报解决 1无用