Mang_Guo_000 2017-08-28 08:57 采纳率: 40%
浏览 3232
已采纳

python处理文本中结构化数据的问题

图片说明
如图所示,有一批文本数据,包含学生的姓名,年龄,家乡学号以及格言,每项占一行,每名同学信息以空行隔开,现在想用python将其转换为如下形式:
图片说明

import sys,os,string

def readvote(file_in,file_ou):
fp_in = open(file_in,'r')
fp_ou = open(file_ou,'w+')
flag = ["nam","age","hom","num","txt"]
str_ou = ""
for line in fp_in:
for i in range(0,len(flag)):
sub_flag = line[0:3]
if sub_flag == flag[i]:
str_i = line[4:len(line)].replace("\n",",")
str_ou = str_ou + str_i
str_ou = str_ou[0:(len(str_ou)-1)]
fp_ou.write(str_ou)
if name =='__main__':
path_in = r"d:\v0\student.txt"
path_ou = r"d:\v1\student_v.txt"
readvote(path_in,path_ou)

结果就是这样:
图片说明

自己临时想的这个代码确实有很大的bug,也曾想过用字典来处理,但是字典的顺序是随机的,不适合处理。希望大神多多指教。谢谢

  • 写回答

2条回答

  • threenewbee 2017-08-28 16:01
    关注
    本回答被题主选为最佳回答 , 对您是否有帮助呢?
    评论
查看更多回答(1条)

报告相同问题?

悬赏问题

  • ¥100 关于使用MATLAB中copularnd函数的问题
  • ¥20 在虚拟机的pycharm上
  • ¥15 jupyterthemes 设置完毕后没有效果
  • ¥15 matlab图像高斯低通滤波
  • ¥15 针对曲面部件的制孔路径规划,大家有什么思路吗
  • ¥15 钢筋实图交点识别,机器视觉代码
  • ¥15 如何在Linux系统中,但是在window系统上idea里面可以正常运行?(相关搜索:jar包)
  • ¥50 400g qsfp 光模块iphy方案
  • ¥15 两块ADC0804用proteus仿真时,出现异常
  • ¥15 关于风控系统,如何去选择