qq_16508607 2021-11-30 17:56 采纳率: 100%
浏览 41
已结题

python提取word中表格内容,由于单元格中多余回车,导致获取单元格数据不准确

img

python操作word文档表格:

rows = len(tables[0].rows)    
for row in range(2, rows):
        colid = tables[0].cell(row,0).text.strip()
        colname =tables[0].cell(row,1).text.strip()
        datatype = tables[0].cell(row,2).text.replace("(","(").replace(")",")").strip()
        nullable =tables[0].cell(row,3).text.strip() 
        pkindex = tables[0].cell(row,4).text.replace(",",",").upper().strip()
conlist.extend([[colid, colname, datatype, nullable, pkindex]])
print("表格内容=",conlist)

想要达到的效果是
表格内容=[['APPLYORDERID', '申请单编号', 'NUMBER(14)', 'NOT NULL', 'PK INDEX'],
['REGION', '地市', 'NUMBER(5)', 'NOT NULL', '']]
但由于表格中内容填写不规范,截图中圈红部分多了回车,导致最后打印结果为:
表格内容=[['APPLYORDERID', '申请单编号', 'NUMBER(14)', 'NOT NULL', 'PK'],
['APPLYORDERID', '申请单编号', 'NUMBER(14)', 'NOT NULL', 'INDEX'],
['REGION', '地市', 'NUMBER(5)', 'NOT', ''], ['REGION', '地市', 'NUMBER(5)', ' NULL', '']]
请问下代码应该如何修改?

  • 写回答

1条回答 默认 最新

  • CSDN专家-黄老师 2021-11-30 18:34
    关注

    你将数据输出,看看多余的回车在数据里面表示什么,然后再针对性处理就行了

    本回答被题主选为最佳回答 , 对您是否有帮助呢?
    评论

报告相同问题?

问题事件

  • 系统已结题 12月11日
  • 已采纳回答 12月3日
  • 创建了问题 11月30日