Mang_Guo_000 2017-08-28 08:57 采纳率: 40%
浏览 3233
已采纳

python处理文本中结构化数据的问题

图片说明
如图所示,有一批文本数据,包含学生的姓名,年龄,家乡学号以及格言,每项占一行,每名同学信息以空行隔开,现在想用python将其转换为如下形式:
图片说明

import sys,os,string

def readvote(file_in,file_ou):
fp_in = open(file_in,'r')
fp_ou = open(file_ou,'w+')
flag = ["nam","age","hom","num","txt"]
str_ou = ""
for line in fp_in:
for i in range(0,len(flag)):
sub_flag = line[0:3]
if sub_flag == flag[i]:
str_i = line[4:len(line)].replace("\n",",")
str_ou = str_ou + str_i
str_ou = str_ou[0:(len(str_ou)-1)]
fp_ou.write(str_ou)
if name =='__main__':
path_in = r"d:\v0\student.txt"
path_ou = r"d:\v1\student_v.txt"
readvote(path_in,path_ou)

结果就是这样:
图片说明

自己临时想的这个代码确实有很大的bug,也曾想过用字典来处理,但是字典的顺序是随机的,不适合处理。希望大神多多指教。谢谢

  • 写回答

2条回答 默认 最新

  • threenewbee 2017-08-28 16:01
    关注
    本回答被题主选为最佳回答 , 对您是否有帮助呢?
    评论
查看更多回答(1条)

报告相同问题?

悬赏问题

  • ¥15 微信小程序 用oss下载 aliyun-oss-sdk-6.18.0.min client报错
  • ¥15 ArcGIS批量裁剪
  • ¥15 labview程序设计
  • ¥15 为什么在配置Linux系统的时候执行脚本总是出现E: Failed to fetch http:L/cn.archive.ubuntu.com
  • ¥15 Cloudreve保存用户组存储空间大小时报错
  • ¥15 伪标签为什么不能作为弱监督语义分割的结果?
  • ¥15 编一个判断一个区间范围内的数字的个位数的立方和是否等于其本身的程序在输入第1组数据后卡住了(语言-c语言)
  • ¥15 Mac版Fiddler Everywhere4.0.1提示强制更新
  • ¥15 android 集成sentry上报时报错。
  • ¥15 抖音看过的视频,缓存在哪个文件