qq_16508607
2021-11-30 17:56
采纳率: 100%
浏览 28

python提取word中表格内容,由于单元格中多余回车,导致获取单元格数据不准确

img

python操作word文档表格:

rows = len(tables[0].rows)    
for row in range(2, rows):
        colid = tables[0].cell(row,0).text.strip()
        colname =tables[0].cell(row,1).text.strip()
        datatype = tables[0].cell(row,2).text.replace("(","(").replace(")",")").strip()
        nullable =tables[0].cell(row,3).text.strip() 
        pkindex = tables[0].cell(row,4).text.replace(",",",").upper().strip()
conlist.extend([[colid, colname, datatype, nullable, pkindex]])
print("表格内容=",conlist)

想要达到的效果是
表格内容=[['APPLYORDERID', '申请单编号', 'NUMBER(14)', 'NOT NULL', 'PK INDEX'],
['REGION', '地市', 'NUMBER(5)', 'NOT NULL', '']]
但由于表格中内容填写不规范,截图中圈红部分多了回车,导致最后打印结果为:
表格内容=[['APPLYORDERID', '申请单编号', 'NUMBER(14)', 'NOT NULL', 'PK'],
['APPLYORDERID', '申请单编号', 'NUMBER(14)', 'NOT NULL', 'INDEX'],
['REGION', '地市', 'NUMBER(5)', 'NOT', ''], ['REGION', '地市', 'NUMBER(5)', ' NULL', '']]
请问下代码应该如何修改?

  • 写回答
  • 好问题 提建议
  • 追加酬金
  • 关注问题
  • 邀请回答

1条回答 默认 最新

相关推荐 更多相似问题