MPI 集合通信例子

Message-Passing-Interface:
是用于在分布式内存环境中为并行计算机编写可移植的代码。
我们有时候会使用mpi_send（mpi_recv）来进行点对点通信，从而实现从一个节点发送数据给另一个节点的功能。但是，有时候，我们需要从一个节点往其他所有节点都要发送东西，这个时候就会用到集合通信。

使用MPI_Bcast进行广播

这里写图片描述
从图中可以看出，MPI_Bcast会给所有节点发送相同的数据。

MPI_Bcast(
    void* data,
    int count,
    MPI_Datatype datatype,
    int root,
    MPI_Comm communicator)

第一个参数data就是所要发送的数据，这个数据包含count个 datatype类型，root是指广播的节点，communicator是指通信子。

使用MPI_Scatter

这里写图片描述
和MPI_Bcast不同的是，MPI_scatter发送不同的数据给不同的节点。

MPI_Scatter(
    void* send_data,
    int send_count,
    MPI_Datatype send_datatype,
    void* recv_data,
    int recv_count,
    MPI_Datatype recv_datatype,
    int root,
    MPI_Comm communicator)

第一个参数send_data是指root节点要发送的数据，然后要发送send_count个send_datatype类型的数据给每个节点。如果send_count是1，send_datatype是MPI_INT,root为0，那么就是0号节点拿到数组的第一个元素，1号节点拿到数组的第二个元素，以此类推。如果send_count是2，那就是0号几点拿到第一个和第二个元素，二号节点拿到第三个和第四个元素，以此类推。
recv_data，就是每个节点接收数据的缓冲区，每个节点要收到recv_count个recv_datatype的元素。

使用MPI_Gather

MPI_Gather是和MPI_Scatter相反的过程。
这里写图片描述

MPI_Gather(
    void* send_data,
    int send_count,
    MPI_Datatype send_datatype,
    void* recv_data,
    int recv_count,
    MPI_Datatype recv_datatype,
    int root,
    MPI_Comm communicator)

对于MPI_Gather来说，只有root节点需要有一个有效的接收缓冲区，其他的节点可以将recv_data设置为NULL。主要一点是，recv_count是每个节点要接收的元素数量。

例子

这个例子就是将一个结构体使用MPI_Bcast发送到其他的节点，然后使用MPI_Gather再从其它节点收回来。

#include <stdio.h>
#include <stdlib.h>
#include <mpi.h>
#include <vector>


int numnodes,myid,mpi_err;

//定义根节点是0号节点
#define mpi_root 0  

//要发送的结构体
struct AA
{
    int a;
    int b;
};

void init_it(int  *argc, char ***argv);

void init_it(int  *argc, char ***argv) {
    mpi_err = MPI_Init(argc,argv);
    mpi_err = MPI_Comm_size( MPI_COMM_WORLD, &numnodes );
    mpi_err = MPI_Comm_rank(MPI_COMM_WORLD, &myid);
}

int main(int argc,char *argv[]){

    init_it(&argc,&argv);

    AA aa;
    std::vector<AA> aas;
    if(myid == mpi_root){
        aa.a = 12;
        aa.b = 13;//给结构体赋值
        aas.push_back(aa);//这个地方为了方便，将结构体放到一个vector中进行发送。
    }
        int length = sizeof(AA)*aas.size();

         MPI_Bcast(&length, 1, MPI_INT, mpi_root, MPI_COMM_WORLD);//先发送一下要发的数量，告诉其它进程我要发送这么多数据过来

         aas.resize(length/sizeof(AA));
         //发给其它进程要发送的数据
    mpi_err = MPI_Bcast(    aas.data(),length,   MPI_BYTE,
                            mpi_root,
                            MPI_COMM_WORLD);

    printf("[%d]: After Bcast, element a in struct AA  is %d,element b in struct AA is %d\n", myid, aas.at(0).a,aas.at(0).b);


    //每个进程要接收的数据
    std::vector<AA> recvaa;

    if (myid == mpi_root)
    {
        //root进程定义一个有效的缓冲区
        recvaa.resize(numnodes);
    }

    //这边可能进行一下计算，比如说对struct做一些操作，然后将结果返回给0号节点

    //其它所有进程把数据再发送给0号进程
    mpi_err = MPI_Gather(aas.data(),    sizeof(AA),  MPI_BYTE, 
                        recvaa.data(), sizeof(AA),  MPI_BYTE, 
                        mpi_root,                  
                        MPI_COMM_WORLD);

    //0号节点收到数据之后，负责打印
    if (myid == mpi_root)
    {
        for (int i = 0; i < numnodes; ++i)
        {
            printf("results from all processors a= %d ,b = %d \n",recvaa.at(i).a,recvaa.at(i).b);

        }

    }

    mpi_err = MPI_Finalize();
}

结果：
这里写图片描述

值得注意的是，这个在广播到其他节点的时候，先发送了一个长度过去，告诉接受的节点要接收多少数据，如果发送的长度是个固定值的话，这个地方可以省略，如果不是固定值的话，可以这么做。
示例代码下载

使用MPI_Bcast进行广播

使用MPI_Scatter

使用MPI_Gather

例子

猜你喜欢