qq_16508607 2021-11-30 17:56 采纳率: 100%
浏览 33
已结题

python提取word中表格内容,由于单元格中多余回车,导致获取单元格数据不准确

img

python操作word文档表格:

rows = len(tables[0].rows)    
for row in range(2, rows):
        colid = tables[0].cell(row,0).text.strip()
        colname =tables[0].cell(row,1).text.strip()
        datatype = tables[0].cell(row,2).text.replace("(","(").replace(")",")").strip()
        nullable =tables[0].cell(row,3).text.strip() 
        pkindex = tables[0].cell(row,4).text.replace(",",",").upper().strip()
conlist.extend([[colid, colname, datatype, nullable, pkindex]])
print("表格内容=",conlist)

想要达到的效果是
表格内容=[['APPLYORDERID', '申请单编号', 'NUMBER(14)', 'NOT NULL', 'PK INDEX'],
['REGION', '地市', 'NUMBER(5)', 'NOT NULL', '']]
但由于表格中内容填写不规范,截图中圈红部分多了回车,导致最后打印结果为:
表格内容=[['APPLYORDERID', '申请单编号', 'NUMBER(14)', 'NOT NULL', 'PK'],
['APPLYORDERID', '申请单编号', 'NUMBER(14)', 'NOT NULL', 'INDEX'],
['REGION', '地市', 'NUMBER(5)', 'NOT', ''], ['REGION', '地市', 'NUMBER(5)', ' NULL', '']]
请问下代码应该如何修改?

  • 写回答

1条回答 默认 最新

      报告相同问题?

      相关推荐 更多相似问题

      问题事件

      • 系统已结题 12月11日
      • 已采纳回答 12月3日
      • 创建了问题 11月30日

      悬赏问题

      • ¥15 edge跟谷歌浏览器的默认搜索引擎无法修改,如何解决?
      • ¥15 access数据库出错
      • ¥100 matlab数学建模习题,求解答
      • ¥15 blender python输出纹理坐标(像素级)与三维坐标的对应关系
      • ¥15 python文件分发
      • ¥15 关于#c语言#的问题:要求:输出格式要界面直观、清晰大方、格式规范
      • ¥15 计算机组成汇编语言电路升级
      • ¥15 hadoop网站点击流数据分析项目
      • ¥15 TDA4 USB 识别不到的问题
      • ¥36 禁用ssl重协商以达到解决DOS漏洞