通过Python multiprocessing库的Pool进程池实现多进程并等待所有进程执行完毕的问题

问题描述：我在正在通过Python执行shell命令来调用本专业软件进行大量分析，每条命令执行完（即软件分析完成）后会自动生成一些文件，接着要读取这些文件，因为需要反复调用本专业软件的次数太多，而且本专业软件单独分析一次需要十几秒，所以此想要了并行的概念。

目的：我需要同时执行上百条shell命令，并在命令完全执行完毕后，接着读取本专业软件生成的结果文件，我先后使用了两种办法去解决问题，具体如下

方案一：仅使用subprocess库，代码如下，

import subprocess as sbp

processes = []
for ii in range(10):
    newfolder = 'test' + str(ii + 1)
    cc = sbp.Popen(cmd, cwd=newfolder, shell=True)
    processes.append(cc)

for jj in range(10):
    processes[jj].wait()

这段代码运行完毕会生成几个文件，后续代码的功能是读取这些文件，如果只是两三条命令同时执行，不会出问题，但当我试图同时执行10条命令时，运行后极少数情况会正常，大多时候会报错，报错的提示就是没有发现某某文件，打开失败，由此判断应该是某些文件夹下的cmd命令并没有执行完毕。请问朋友们该怎么处理？

方案二：使用subprocess库和multiprocessing库，代码如下，

import subprocess as sbp
import multiprocessing as mlp

def run_shell(number):
    sbp.Popen(cmd, cwd='test' + str(number), shell=True)

numlist = [ii + 1 for ii in range(100)]
pool = mlp.Pool(100)
pool.map(run_shell, numlist)
pool.close()
pool.join()

类似的，执行过程也会因为没有生成某些文件打开失败而中断，经过学习，我了解到受计算机CPU数的限制，例如CPU数为4，则程序会创建4个进程，待其中之一执行完毕后才会执行第5条命令，请问大家如何保证这100个进程全部运行结束再执行后续代码？

此外，将这两种方案导入time模块进行计时，发现方案一输出的时间包含了本专业软件运行消耗的时间，而方案二输出的时间似乎只是创建进程消耗的时间，如何使方案二把调用本专业软件进行分析的用时也涵盖上呢？

写回答
好问题 0 提建议
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

5条回答默认最新

chuifengde 2022-11-11 15:07

关注

看例子，用队列来实现，监测每个子进程的执行完成状态，子进程执行完成后入队：
import subprocess as sp
import multiprocessing as mp
import time

def run_exe(q, code):
    s1 = time.time()
    p = sp.Popen('test.py ' + str(code),shell = True)
    while 1:
        if p.poll() == 0:
            q.put((p.pid, code, time.time() - s1))
            break

if __name__ == "__main__":    
    jobs = []
    qq = mp.Queue()
    for i in range(20):
        pp = mp.Process(target = run_exe, args = (qq,i ))
        jobs.append(pp)
        pp.start()
        
    for s in jobs:
        s.join()

    for _ in jobs:
        cur = qq.get()
        print(cur)
        #这里能获得子进程id及对应的传入参数及运行时间
--result
(6784, 2, 6.593695163726807)
(14944, 0, 8.390507698059082)
(2144, 1, 9.3748459815979)
(11824, 5, 10.656054019927979)
(4360, 11, 9.8748300075531)
(13596, 4, 11.034750699996948)
(15308, 6, 12.576527833938599)
(13056, 8, 12.155471563339233)
(13684, 3, 11.481432437896729)
(15328, 14, 12.865367650985718)
(15092, 7, 13.527697086334229)
(5640, 9, 13.480824947357178)
(6776, 12, 13.168334484100342)
(15508, 17, 13.965184450149536)
(6420, 15, 13.152710437774658)
(14260, 10, 13.605820655822754)
(15896, 16, 12.652727127075195)
(3400, 13, 12.980840921401978)
(8112, 18, 12.730849266052246)
(13944, 19, 13.215219497680664)



#我的test.py程序是被调用程序
dirname = r'C:\Users\Administrator\Desktop\stss'

import sys 

args = sys.argv
code=int(sys.argv[1])
a = []
for i in range(100):
    for j in range(code*1000):
        a.append(i*j)
with open(dirname+'/tt'+str(code)+'.txt',mode='w',encoding='utf-8')    as f:    
    print(a,file =f )

本回答被题主选为最佳回答 , 对您是否有帮助呢?

编辑记录

查看更多回答(4条)

报告相同问题？

关注问题

Python多进程库multiprocessing中进程池Pool类的使用详解
2020-09-21 01:11

### Python多进程库multiprocessing中进程池Pool类的使用详解 #### 一、引言在进行大规模数据处理或计算密集型任务时，利用多核处理器的优势是非常重要的。Python 的 `multiprocessing` 模块提供了丰富的功能来...
Python multiprocessing 5 进程池 pool 多核运算教程
2026-01-12 21:52

打开链接下载源码： https://pan.quark.cn/s/86a90a249364 Python中的multiprocessing模块之5_进程池的使用（pool_）_涉及多进程和多核计算_提供教学指导tutorial
Python多进程池 multiprocessing Pool用法示例
2020-09-20 03:05

Python的`multiprocessing`库是实现多进程编程的重要工具，其中`Pool`类提供了一种高效的方式来管理和控制多个进程。本文将深入探讨`multiprocessing.Pool`的使用方法、原理以及如何在实际应用中发挥它的优势。 1. ...
Python多进程编程：深入理解multiprocessing模块
2024-11-24 11:10

multiprocessing模块作为Python多进程编程的核心，通过提供丰富的API，使得开发者能够有效地利用多核处理器的优势，实现高效的并行计算。无论是进行简单的并发执行，还是处理复杂的并行数据处理任务，...
Python多进程multiprocessing.Pool类详解
2020-09-20 13:38

Python的`multiprocessing`模块是实现多进程编程的关键工具，尤其在处理大量计算任务或并发操作时，能够充分利用多核CPU的优势。`multiprocessing.Pool`类是`multiprocessing`模块中的核心类，它允许我们创建一个...
Python Multiprocessing多进程 使用tqdm显示进度条的实现
2020-09-18 20:31

在Python编程中，当面临计算密集型任务时，单线程的执行方式可能无法充分利用多核CPU的优势，这时就需要引入多进程技术来提升程序的运行效率。Python的`multiprocessing`模块提供了创建多进程的功能，而`tqdm`库则...
Python 多进程并发操作中进程池Pool的实例
2020-09-21 02:34

`pool.apply_async()`用于异步地将任务添加到进程池，`pool.close()`确保不再接受新的任务，`pool.join()`则等待所有任务执行完毕。`result.successful()`检查任务是否成功执行，如果还有未完成的任务，它会抛出异常...
一文速通Python并行计算：12 Python多进程编程-进程池Pool
2025-06-05 00:27

Freak嵌入式的博客在Python多进程编程中，Pool类用于创建进程池，可并行执行多个任务。通过map、apply等方法，将函数和参数分发到子进程，提高CPU利用率，简化进程管理，便于资源复用。适用于CPU密集型场景。
Python多进程multiprocessing、进程池用法实例分析
2020-09-17 16:18

Python的多进程编程是通过`multiprocessing`模块实现的，该模块提供了进程管理以及进程池的功能，使得在Python中能够方便地创建和控制多个独立运行的进程。在Python中，多进程比多线程更适合于CPU密集型任务，因为每...
Python基于进程池实现多进程过程解析
2020-09-16 22:50

调用`pool.close()`关闭进程池，不再接受新的任务，最后调用`pool.join()`阻塞主进程，等待所有子进程执行完毕。通过以上的理解，我们可以看出Python的`multiprocessing.Pool`提供了一种高效且灵活的方式来管理和...
Python Python多进程池（Pool）==ProcessPoolExecutor multiprocessing.Pool
2025-06-28 11:09

贵哥的编程之路(热爱分享为后来者)的博客进程池是一种高效管理和复用进程...进程池执行完毕才能获取所有结果，要用close/join（Pool）或shutdown（ProcessPoolExecutor）等待任务完成。获取执行成功的taskimap（Pool）：边计算边获取结果，按完成顺序返回。
Python多进程编程multiprocessing代码实例
2020-09-17 17:48

Python的`multiprocessing`模块是实现多进程编程的关键工具，它允许程序同时运行多个独立的Python解释器，每个解释器可以执行不同的任务，从而提高程序的并发性。本篇文章将深入探讨`multiprocessing`模块的基本用法...
python 进程池等待数量_python 进程池multiprocessing.Pool
2020-12-10 21:12

weixin_39637370的博客 44.Python 进程池multiprocessing.Pool最后更新于：2020-03-21 11:53:37python进程池Pool 和前面讲解的python线程池类似，虽然使用多进程能提高效率，但是进程的创建会消耗大量的计算机资源(进程Process的创建远远...
Python高级编程之消息队列(Queue)与进程池(Pool)实例详解
2020-09-18 12:09

Python中的消息队列（Queue）和进程池（Pool）是实现多进程程序中进程间通信和管理的有效工具。它们可以帮助开发者在多核处理器上充分利用计算资源，提高程序的执行效率。首先我们来看消息队列（Queue）：在...
Python multiprocessing 5 进程池 pool (多进程 多核运算教学教程tutorial)
2021-08-31 09:17

Python_multiprocessing_5_进程池_pool_(多进程_多核运算_教学教程tutorial)
python进程池实现的多进程文件夹copy器完整示例
2020-09-18 09:13

本文介绍了一个使用Python语言结合进程池（multiprocessing）来实现的多进程文件夹拷贝器的完整示例。在介绍这个程序之前，需要了解几个关键概念：多进程编程、进程池以及文件操作。 ### 多进程编程 多进程编程是...
Python进程池：高效并行处理的实践指南
2024-11-06 11:12

使用Python的multiprocessing模块中的Pool类，开发者能够方便地管理进程池，并异步提交和获取任务执行结果。进程池的概念和用途涉及将多个任务分配给不同的工作进程并行执行，这在处理大量任务时尤为重要。进程池...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
系统已结题 11月24日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
已采纳回答 11月16日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 11月11日

通过Python multiprocessing库的Pool进程池实现多进程并等待所有进程执行完毕的问题

5条回答 默认 最新

问题事件

5条回答默认最新