pingfanren2 2021-03-05 23:08 采纳率: 80%
浏览 804
已结题

python使用python-docx模块读取word表格发生重复

import os
import docx


if __name__=='__main__':
    workpath=str(os.getcwdb(),encoding='utf-8') #获取当前目录
    filepath=workpath+r'\test2.docx' #获取文件目录
    doc1=docx.Document(filepath) #打开文件
    tables=doc1.tables
    table=tables[0]

    for row in table.rows:
        for cell in row.cells:
            print(cell.text,end=' ')
        print('\n')
    print('end')

word文件放在云盘里,代码如上,具体问题如下,很多cell读取的时候都重复读取了好多遍,我也不知道怎么回事,这个表格是学校下发的表格,不是自己做的,非常感谢。https://kdocs.cn/l/siUDPGHApKNE
[金山文档] test2.docx

  • 写回答

4条回答 默认 最新

  • qq_34480387 2021-04-02 17:52
    关注

    遍历的时候有意识去重就可以了

    value_list = list()
    for row in table.rows:
        temp = list()
        for cell in row.cells:
            if cell.text not in temp:
                 temp.append(cell.text)
                 print(cell.text,end=' ')
        print('\n') print('end')
        value_list.append(temp)
    本回答被题主选为最佳回答 , 对您是否有帮助呢?
    评论
查看更多回答(3条)

报告相同问题?

问题事件

  • 系统已结题 8月23日
  • 已采纳回答 8月15日

悬赏问题

  • ¥15 微信小程序 用oss下载 aliyun-oss-sdk-6.18.0.min client报错
  • ¥15 ArcGIS批量裁剪
  • ¥15 labview程序设计
  • ¥15 为什么在配置Linux系统的时候执行脚本总是出现E: Failed to fetch http:L/cn.archive.ubuntu.com
  • ¥15 Cloudreve保存用户组存储空间大小时报错
  • ¥15 伪标签为什么不能作为弱监督语义分割的结果?
  • ¥15 编一个判断一个区间范围内的数字的个位数的立方和是否等于其本身的程序在输入第1组数据后卡住了(语言-c语言)
  • ¥15 Mac版Fiddler Everywhere4.0.1提示强制更新
  • ¥15 android 集成sentry上报时报错。
  • ¥15 抖音看过的视频,缓存在哪个文件