liehongqiang4494 2022-08-11 10:43 采纳率: 100%
浏览 42
已结题

请问怎么能提升效率啊?我这代码贼垃圾

问题遇到的现象和发生背景

有一个excel表里有1000项数据,要在十几个word文档里找这些数据,excel中数据能在word里找到就标记一下。问题:把遍历表格那段注释掉以后运行速度还行,加上遍历表格就巨慢,怎么能提升效率啊?

问题相关代码,请勿粘贴截图

from openpyxl import workbook
from openpyxl import load_workbook
from docx import Document
import os

def search(docname):

    document = Document(docname)
     

    for i in range(1038):
        a=i+1
        #print(ws.cell(a,4).value)
        searchtarget = ws.cell(a,4).value
        
        for paragraph in document.paragraphs:
            #print(paragraph.text)
            p=str(searchtarget)
            pp=str(paragraph.text)
            if p in pp:

                print(ws.cell(a,4).value)
                ws.cell(a,13).value=docname
                
        tables=document.tables   #遍历表格
        for tb in document.tables:

            ii=0
            jj=0
        
            for i in tb.rows:
                jj=0
            
                for j in tb.columns:
                    p=str(searchtarget)
                    pp=str(tb.cell(ii,jj).text)
                    try:
                        if p in pp:
                            print(ws.cell(a,4).value)
                            ws.cell(a,13).value=docname
                            
                    except:
                        print("error")
                    
                        break
                    if jj<len(tb.columns)-1:
                        jj=jj+1
                if ii<len(tb.rows)-1:
                    ii=ii+1


if __name__ == "__main__":

    excel=load_workbook('新建 Microsoft Excel 工作表.xlsx')
    ws=excel['Sheet1']
    search('卷).docx')
    search('卷).docx')
    search('卷).docx')
    search('册二).docx')
    search('册三).docx')
    search('册一).docx')
    search('册).docx')
    search('明书.docx')
    search('书.docx')
    search('册.docx')
    search('册.docx')
    search('书.docx')



  • 写回答

1条回答 默认 最新

  • kakaccys 2022-08-12 22:48
    关注
    import pandas as pd
    df = pd.read_excel('新建 Microsoft Excel 工作表.xlsx', index_col=None)
    df = df[df["某一列"].str.contains("卷).docx")]
    
    本回答被题主选为最佳回答 , 对您是否有帮助呢?
    评论

报告相同问题?

问题事件

  • 系统已结题 8月26日
  • 已采纳回答 8月18日
  • 创建了问题 8月11日

悬赏问题

  • ¥15 基于卷积神经网络的声纹识别
  • ¥15 Python中的request,如何使用ssr节点,通过代理requests网页。本人在泰国,需要用大陆ip才能玩网页游戏,合法合规。
  • ¥100 为什么这个恒流源电路不能恒流?
  • ¥15 有偿求跨组件数据流路径图
  • ¥15 写一个方法checkPerson,入参实体类Person,出参布尔值
  • ¥15 我想咨询一下路面纹理三维点云数据处理的一些问题,上传的坐标文件里是怎么对无序点进行编号的,以及xy坐标在处理的时候是进行整体模型分片处理的吗
  • ¥15 CSAPPattacklab
  • ¥15 一直显示正在等待HID—ISP
  • ¥15 Python turtle 画图
  • ¥15 stm32开发clion时遇到的编译问题