使用MPI广播数据遇到阻塞

以下代码使用了MPI广播数据，但是我发现它存在阻塞的问题，代码如下：


def load_state_dict(path, **kwargs):
    """
    Load a PyTorch file without redundant fetches across MPI ranks.
    """
    chunk_size = 2**30  # MPI has a relatively small size limit
    if MPI.COMM_WORLD.Get_rank() == 0:
        with bf.BlobFile(path, "rb") as f:
            data = f.read()
        num_chunks = len(data) // chunk_size
        if len(data) % chunk_size:
            num_chunks += 1
        MPI.COMM_WORLD.bcast(num_chunks)
        for i in range(0, len(data), chunk_size):
            MPI.COMM_WORLD.bcast(data[i : i + chunk_size])
    else:
        num_chunks = MPI.COMM_WORLD.bcast(None)
        data = bytes()
        for _ in range(num_chunks):
            data += MPI.COMM_WORLD.bcast(None)

    return th.load(io.BytesIO(data), **kwargs)

调试后发现阻塞位置在这个地方,在循环最后一次发生了阻塞：

for i in range(0, len(data), chunk_size):
            MPI.COMM_WORLD.bcast(data[i : i + chunk_size])

请问如何解决？为什么这里会发生阻塞？

写回答
好问题 0 提建议
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

26条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
专家-赤兔[在线] 优质创作者: 编程框架技术领域 2024-05-30 14:09
关注
获得0.40元问题酬金
引自免费微信小程序：皆我百晓生

为了解决这个问题，我们需要理解 MPI 的工作原理。MPI（Message Passing Interface）是一种用于并行计算的标准库，允许进程间通信。在您的代码中，所有非主进程都在等待最后一个块的数据广播完成，然后才会继续执行。这是因为 bcast 函数是同步的，这意味着发送方会一直等待直到所有接收方都接收到数据。

要解决这个问题，我们可以稍微调整代码结构，使得非主进程在开始接收数据之前就开始处理已经接收到的块。这样可以避免在最后一轮广播时的阻塞。这里是一个修改后的版本：

import torch as th from mpi4py import MPI def load_state_dict_mpichunked(path, **kwargs): """ Load a PyTorch file without redundant fetches across MPI ranks using a chunk-based approach. """ chunk_size = 2**30 # MPI has a relatively small size limit comm = MPI.COMM_WORLD if comm.Get_rank() == 0: with open(path, "rb") as f: data = f.read() num_chunks = len(data) // chunk_size if len(data) % chunk_size: num_chunks += 1 comm.bcast(num_chunks) chunks_to_send = [data[i:i+chunk_size] for i in range(0, len(data), chunk_size)] for chunk in chunks_to_send: comm.bcast(chunk) else: num_chunks = comm.bcast(None) chunks_to_recv = [[] for _ in range(num_chunks)] for i in range(num_chunks): chunk = comm.bcast(None) chunks_to_recv[i].append(chunk) data = b''.join([b''.join(chunk) for chunk in chunks_to_recv]) return th.load(io.BytesIO(data), **kwargs) # 使用新的函数替代原始的load_state_dict state_dict = load_state_dict_mpichunked("your_file_path.pth", **kwargs)

这个修改版的代码将接收端的处理提前到每次接收到一个数据块时就进行。这样，即使是最小的数据块，其他进程也不会阻塞等待。同时，我们从文件读取数据的部分也进行了优化，直接使用 Python 的文件操作，而不是通过 bf.BlobFile。

请注意，您需要安装 mpi4py 库才能运行这段代码，可以使用 pip 安装：pip install mpi4py。此外，确保您的环境中安装了 OpenMPI 或者 MPICH 等 MPI 实现。
解决无用
评论打赏
分享
举报编辑记录

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

mpi.rar_MPI_mpi并行_pdf_并行编程
2022-09-20 15:01

MPI是一种编程模型，它定义了一组标准的函数调用，程序员可以使用这些函数来编写并行程序，这些程序可以在多处理器系统或分布式内存集群上运行。MPI程序由多个独立的进程组成，每个进程都可以在不同的节点上运行，...
MPI编程指南共12页.pdf.zip
2022-10-28 11:08

**MPI编程指南共12页.pdf.zip** **MPI（Message Passing Interface）** 是一个工业标准，用于编写并行计算程序，特别是在分布式内存系统上。它为程序员提供了一组丰富的通信原语，允许运行在不同处理器上的进程之间...
高性能计算MPI_编程_高性能计算MPI_
2021-10-03 05:03

在高性能计算领域，MPI（Message Passing Interface）是一种广泛使用的并行编程模型，它允许程序员在分布式内存系统上编写高效的并行程序。MPI编程是实现大规模并行计算的关键技术，尤其适用于超级计算机和集群环境...
高性能计算之并行编程技术—— MPI并行程序设计.zip
2021-12-28 10:58

总结来说，"高性能计算之并行编程技术—— MPI并行程序设计"这一主题涵盖了并行计算的基础理论、MPI接口的使用方法以及并行程序设计的实践策略。通过学习和掌握这些内容，开发者可以构建出能够充分利用硬件资源的高...
MPI编程案例01-广播通信（基础版）
2025-03-16 22:14

researcher-Jiang的博客 IN/OUT　buffer　通信消息缓冲区的起始地址(可变)IN　count　通信消息缓冲区中的数据个数(整型)IN datatype 通信消息缓冲区中的数据类型(句柄)IN　root　发送广播的根的序列号(整型)IN comm 通信子(句柄)注意看，...
25、MPI消息传递编程全解析
2025-07-23 05:04

a0b1c2d3的博客通过详细说明非阻塞发送与接收操作的工作原理及使用方法，以及广播、累积、收集、散射等集体通信操作的示例，帮助开发者更好地理解和应用MPI进行高效并行计算。同时，还介绍了如何选择合适的通信模式和减少通信量等...
mpi.cr：Crystal语言的MPI绑定
2021-02-04 22:42

在这个场景中，“mpi.cr”是为Crystal编程语言提供的一个MPI绑定，使得Crystal程序员可以利用MPI的功能进行大规模并行计算。 Crystal语言是一种静态类型的、编译型的、面向对象的编程语言，设计时受到了Ruby的影响...
MPI并行编程：从基础到实战的完整指南
2025-07-26 09:49

AlgoCraft的博客其次详细讲解了数据类型系统，涵盖内置类型和派生类型的创建流程；然后重点阐述了核心通信模式（分发、聚合、非阻塞通信）及其优化方法；最后通过并行矩阵乘法的实战案例，展示了MPI在实际问题中的应用，并提供了...
并行计算之MPI简介以及基本通信案例(阻塞，非阻塞)
2023-08-29 22:09

KingOfMyHeart的博客 MPI_Test 函数的作用与 MPI_Wait 函数类似，都是等待一个请求对象进入完成状态，但 MPI_Test 函数是非阻塞的，即当请求对象尚未完成时，MPI_Test 函数会立即返回一个标志值，而不会阻塞当前进程的执行。通信域中的每...
OpenMPI编程学习笔记
2023-05-10 10:18

它提供了标准的MPI接口，使得程序员可以编写跨平台的并行程序，支持多种编程语言，如C、C++、Fortran等。OpenMPI在高性能计算领域广泛使用，特别是在超级计算机和大规模集群上。在学习OpenMPI的过程中，首先要理解...
MPI跨平台仿真安装程序
2021-04-19 19:31

7. **并行编程模型**：理解MPI的核心概念，如进程（process）、进程管理、通信模式（point-to-point和collective）以及非阻塞I/O，是编写有效并行程序的基础。 8. **并行算法设计**：并行化不是简单地将任务分解，...
19、MPI并行编程入门
2025-07-28 00:57

dell8的博客内容涵盖基本函数如MPI_Init、MPI_Comm_rank、MPI_Send和MPI_Recv的使用，以及非阻塞通信MPI_Isend和MPI_Irecv的工作原理。此外，还详细讲解了如何编译和执行MPI程序，并通过示例代码演示了广播、归约、分散和收集等...
STM32最小系统设计核心四模块详解
2025-12-10 10:06

情绪过载的博客同时，深入讲解了MPI编程的基础与进阶内容，涵盖MPI初始化、点对点通信、非阻塞通信、集体通信（广播、散射、收集、归约）等核心概念，并提供了典型代码示例与编程流程图，帮助读者掌握并行计算的基本原理与实践技巧...
17、MPI：并行编程中的消息传递接口解析
2025-08-08 11:53

fun88的博客本文深入解析了MPI（消息传递接口）在并行编程中的应用，涵盖了MPI简介、编程模型、基本函数、消息发送与接收、全局操作、性能优化技巧及错误处理等内容。通过示例代码和详细说明，帮助开发者掌握MPI的核心概念和...
MPI.zip_linux mpi
2022-09-21 17:33

例如，`MPI_Send`和`MPI_Recv`函数用于发送和接收消息，`MPI_Bcast`用于广播数据，`MPI_Gather`用于聚合数据等。 3. **消息传递**：消息可以是任意大小的数据块，且支持阻塞和非阻塞通信模式，以及点对点和集合通信...
open-mpi:使用 OpenMPI 的并行程序
2021-06-15 08:53

`MPI_Send`和`MPI_Recv`是基础的点对点通信，而`MPI_Bcast`、`MPI_Gather`、`MPI_Scatter`等函数则用于广播、聚集和分散操作，以协调不同进程间的数据交换。 4. **进程同步**：`MPI_Barrier`函数用于确保所有进程在...
全面掌握MPI并行编程
2025-06-13 15:42

鄧寜的博客在这一领域中，消息传递接口（Message Passing Interface，MPI）以其优异的性能和跨平台特性，成为了并行编程领域的国际标准。本章将简要介绍MPI编程及其在分布式内存并行计算中的重要角色，为后续章节深入学习奠定...
31、消息传递编程之MPI入门
2025-08-26 00:04

fire9的博客本文介绍了消息传递编程模型中的MPI（消息传递接口）入门知识，包括消息传递编程模型的基本概念、MPI通信库的发展历程与特点、MPI点对点通信和集体通信的操作方式、进程组与通信器的管理、动态进程创建以及单边通信...
c语言 mpi程序,MPI编程入门详解
2021-05-20 14:39

weixin_39520979的博客 MPI是一个跨语言的通讯协议，用于编写并行计算机。支持点对点和广播。MPI是一个信息传递应用程序接口，包括协议和和语义说明，他们指明其如何在各种实现中发挥其特性。MPI的目标是高性能，大规模性，和可移植性。MPI...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
系统已结题 6月7日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 5月30日

使用MPI广播数据遇到阻塞

26条回答 默认 最新

问题事件

26条回答默认最新