如何在联邦学习中，使前五个客户端不参与联邦学习，而在自身本地训练呢

基于pytorch的联邦学习，使用MNIST数据集

import math
from copy import deepcopy
import numpy as np
import os

import torch
import torch.nn as nn
import torch.nn.functional as F

class MConv2d(nn.Conv2d):
    def __init__(self, in_channels, out_channels, kernel_size, stride=1,
                 padding=0, dilation=1, groups=1, bias=True, padding_mode='zeros'):
        super(MConv2d, self).__init__(in_channels, out_channels, kernel_size, 
                                      stride, padding, dilation=dilation, 
                                      groups=groups, bias=bias, padding_mode=padding_mode)
        self.agg_data = 0
    
    @torch.no_grad()
    def download(self, glb_conv):
        self.weight.data[:] = glb_conv.weight.data
        self.bias.data[:] = glb_conv.bias.data
           
    @torch.no_grad()
    def aggregate(self, oth_conv, oth_data):
        """This method is ONLY called by the global model!!
        """
        loc_weight, loc_bias = oth_conv.weight.data, oth_conv.bias.data
        all_data = self.agg_data + oth_data
        self.weight.data.mul_(self.agg_data / all_data)
        self.weight.data.add_(loc_weight * (oth_data / all_data))
        if self.bias is not None:
            self.bias.data.mul_(self.agg_data / all_data)
            self.bias.data.add_(loc_bias * (oth_data / all_data))
        self.agg_data = all_data
    
    def zero_agg_factor(self):
        """This method is ONLY called by the global model!!
        """
        self.agg_data = 0
class MLinear(nn.Linear):
    def __init__(self, in_features, out_features, bias=True):
        super(MLinear, self).__init__(in_features, out_features, bias)
        self.agg_data = 0

    @torch.no_grad()
    def download(self, glb_lin):
        self.weight.data[:] = glb_lin.weight.data
        self.bias.data[:] = glb_lin.bias.data
    
    @torch.no_grad()
    def aggregate(self, oth_lin, oth_data):
        """This method is ONLY called by the global model!!
        """
        loc_weight, loc_bias = oth_lin.weight.data, oth_lin.bias.data
        all_data = self.agg_data + oth_data
        self.weight.data.mul_(self.agg_data / all_data)
        self.weight.data.add_(loc_weight * (oth_data / all_data))
        if self.bias is not None:
            self.bias.data.mul_(self.agg_data / all_data)
            self.bias.data.add_(loc_bias * (oth_data / all_data))
        self.agg_data = all_data
    
    def zero_agg_factor(self):
        """This method is ONLY called by the global model!!
        """
        self.agg_data = 0
import torch
import torch.nn as nn

class Net(nn.Module):
    def __init__(self, alpha=1):
        super(Net, self).__init__()
        self.conv1 = MConv2d(1, 8, 3, 1, 1)
        self.fc1   = MLinear(14*14*8, 10)
        self.net_module_list = [self.conv1, self.fc1]

    
    @torch.no_grad()
    def download(self, glb_net):
        for glb_module, loc_module in zip(glb_net.net_module_list, self.net_module_list):
            loc_module.download(glb_module)
            
    @torch.no_grad()
    def aggregate(self, loc_net, loc_data_num):
        """This method CAN ONLY called by the global model!!
        """
        for glb_module, loc_module in zip(self.net_module_list, loc_net.net_module_list):
            glb_module.aggregate(loc_module, loc_data_num)
    
    def zero_agg_factor(self):
        for module in self.net_module_list:
            module.zero_agg_factor()
    

    def forward(self, x):
        x = F.relu(self.conv1(x))
        x = F.max_pool2d(x, kernel_size=2, stride=2)
        x = torch.flatten(x, 1)
        x = self.fc1(x)
        return x
import numpy as np
import torch
from torch.utils.data import Dataset
from torchvision import datasets, transforms


class DatasetSplit(Dataset):
    """An abstract Dataset class wrapped around Pytorch Dataset class.
    """

    def __init__(self, dataset, idxs):
        self.dataset = dataset
        self.idxs = [int(i) for i in idxs]

    def __len__(self):
        return len(self.idxs)

    def __getitem__(self, item):
        image, label = self.dataset[self.idxs[item]]
        return image.clone().detach(), torch.tensor(label)

# Independent Identically Distributed(IID)
def get_iid_data(dataset, num_users): # get IID-distribution data 
    num_items = int(len(dataset)/num_users)
    dict_users, all_idxs = {}, [i for i in range(len(dataset))]
    for i in range(num_users):
        dict_users[i] = set(np.random.choice(all_idxs, num_items,
                                             replace=False))
        all_idxs = list(set(all_idxs) - dict_users[i])
    return dict_users

def get_noniid_data(dataset, num_users, alpha):# get non-IID-distribution data 
    np.random.seed(0)
    """
    dataset: training set of CIFAR
    大致的做法是：
        （1）不对图片数据进行划分，而是划分图片数据的索引。这样大家共用一个图片数据存储空间
        （2）按数据集每一类数据分别划分给用户，使用狄利克雷分布来确定用户间划分的比例
        （3）设置了欧皇非酋保底机制，让这个non-iid数据划分不至于太极端
    """
    dict_users = {}
    num_classes = 10
    min_size = 0
    labels = np.array(dataset.targets)              # 数据集的labels
    num_items = int(len(dataset)/num_users)

    while min_size < 10:
        idx_groups = [[] for _ in range(num_users)] # 预先做好每个客户用于存储自己数据集索引的列表，函数要return的就是它
        # for each class in the dataset
        for k in range(num_classes):                # 遍历所有的标签，当前标签为k
            idx_k = np.where(labels == k)[0]        # 取出数据集的labels为当前标签k的索引值列表idx_k
            np.random.shuffle(idx_k)                # 索引值列表idx_k
            proportions = np.random.dirichlet(np.repeat(alpha, num_users))# 生成狄利克雷分布
                                                                  
                 
            # Balance
            proportions = np.array(
                [p*(len(user_idx) < num_items) for p, user_idx in zip(proportions, idx_groups)]
                )#  保底机制，
                 # (len(user_idx) < num_items)为True或者False，即为1或0

            proportions = proportions / proportions.sum() # 重新将置0比例向量重新归一化
            proportions = (np.cumsum(proportions)*len(idx_k)).astype(int)[:-1] # 这一句是为了np.split函数的输入参数而做
            idx_groups = [user_idx + idx.tolist() for user_idx, idx in zip(idx_groups, np.split(idx_k, proportions))]# 将图片索引分到idx_groups
        min_size = min([len(user_idx) for user_idx in idx_groups]) # 保底机制，
    for i in range(num_users):
        np.random.shuffle(idx_groups[i])
        dict_users[i] = idx_groups[i]
    return dict_users

def get_dataset_MNIST(data_dir, num_users, iid=True, alpha=0.5):
    transform_train = transforms.Compose([
        transforms.ToTensor(),
        transforms.Normalize((0.1307,), (0.3081,))
    ]);
    transform_test = transforms.Compose([
        transforms.ToTensor(),
        transforms.Normalize((0.1307,), (0.3081,))
    ])

    train_dataset = datasets.MNIST(data_dir, train=True, download=True,
                                     transform=transform_train)
    test_dataset = datasets.MNIST(data_dir, train=False, download=True,
                                    transform=transform_test)
    
    if iid:
        user_groups = get_iid_data(train_dataset, num_users)
    else:
        user_groups = get_noniid_data(train_dataset, num_users, alpha)

    return train_dataset, test_dataset, user_groups

import os
import copy
import random as rn
import numpy as np
import torch
import torch.nn as nn
from torch.utils.data import DataLoader
import pickle


torch.backends.cudnn.deterministic = True
torch.backends.cudnn.benchmark = False

os.environ["CUDA_VISIBLE_DEVICES"] = '0'


class Client:
    train_set = None
    test_set = None
    local_epoch = None
    batch_size = None
    lr = None
    lr_decay = 0.996
    device = 'cuda'
    criterion = nn.CrossEntropyLoss()

    def __init__(self, train_idx, loc_model, client_id, test_dataset):
        self.trainloader = DataLoader(DatasetSplit(self.train_set, train_idx), 
                                      batch_size=self.batch_size, shuffle=True)
        self.testloader = DataLoader(test_dataset, batch_size=100, shuffle=False)
        self.client_id = client_id
        self.num_data = len(train_idx)
        self.loc_model = loc_model

    def local_update(self, cr):
        self.loc_model.to(self.device)
        lr = self.lr * (self.lr_decay ** cr)
        optimizer = torch.optim.SGD(self.loc_model.parameters(), lr=lr, momentum=0.9)
        self.loc_model.train()
        for ep in range(self.local_epoch):
            for batch_idx, (images, labels) in enumerate(self.trainloader):
                images, labels = images.to(self.device), labels.to(self.device)
                self.loc_model.zero_grad()
                output = self.loc_model(images)
                loss = self.criterion(output, labels)
                loss.backward()
                optimizer.step()
    
    def download(self, glb_model):
        self.loc_model.download(glb_model)
    
    def eval_test(self):
        test_loss = 0
        correct = 0
        total = 0
        self.loc_model.eval()
        with torch.no_grad():
            for batch_idx, (images, labels) in enumerate(self.testloader):
                images, labels = images.to(self.device), labels.to(self.device)
                outputs = self.loc_model(images)
                loss = self.criterion(outputs, labels)
                test_loss += loss.item()
                _, predicted = outputs.max(1)
                total += labels.size(0)
                correct += predicted.eq(labels).sum().item()
        acc = 100.*correct/total
        test_loss /= total
        print('\n client id = %d, Test acc is %.4f'%(self.client_id , acc))
        return acc, test_loss
    
    
    

class Server:
    def __init__(self, clients, test_dataset):
        self.clients = clients
        self.global_model = Net()
        self.testloader = DataLoader(test_dataset, batch_size=100, shuffle=False)
        self.criterion = nn.CrossEntropyLoss()
        self.device = 'cuda'
    
    def distribute(self):
        self.global_model.zero_agg_factor()
        for c in self.clients:
            c.download(self.global_model)
        
    def model_update(self, cr):
        for c in self.clients:
            c.local_update(cr)
            print("\rComm round %d: updating in client %d   " % (cr, c.client_id), end='')
            

    def agg(self, cr, info):
        idx_list = list(range(len(self.clients)))
        self.global_model.zero_agg_factor()
        self.global_model.to(self.device)
        for c_idx in idx_list:
            self.global_model.aggregate(self.clients[c_idx].loc_model, self.clients[c_idx].num_data)
            print("\rComm round %d: aggregated client %d   " % (cr, c_idx), end='')
    
    def eval_test(self):
        test_loss = 0
        correct = 0
        total = 0
        self.global_model.eval()
        with torch.no_grad():
            for batch_idx, (images, labels) in enumerate(self.testloader):
                images, labels = images.to(self.device), labels.to(self.device)
                outputs = self.global_model(images)[:5]
                loss = self.criterion(outputs, labels)
                test_loss += loss.item()
                _, predicted = outputs.max(1)
                total += labels.size(0)
                correct += predicted.eq(labels).sum().item()
        acc = 100.*correct/total
        test_loss /= total
        print('\n Test acc is ', acc)
        return acc, test_loss
        
    def fedlearn(self, total_cr, info):
        acc_list = []
        test_loss_list = []
        for cr in range(total_cr):
            self.distribute()                 # 服务器分发模型到各个客户端
            self.model_update(cr)             # 客户端本地更新模型
            self.agg(cr, info)                # 客户端上传模型，在服务器端聚合
            acc, test_loss = self.eval_test() # 测试联邦学习的全局模型精度
            acc_list.append(acc)
            test_loss_list.append(test_loss)
            
 def main():
    seed = 0
    rn.seed(seed)
    np.random.seed(seed)
    torch.manual_seed(seed)
    num_users = 100
    data_dir = './dataset/MNIST'
    # IID data distribution!!!!!!
    train_dataset, test_dataset, dict_users = get_dataset_MNIST(data_dir, num_users, iid=False)
    Client.train_set = train_dataset
    Client.test_set = test_dataset
    clients = []
    epoch, batch_size, lr, cr = 2, 64, 0.05, 10
    for ir in range(1,2): # 做实验一般跑几遍取平均值，这里只跑一次
        info = (epoch, batch_size, lr, ir)
        print("***********************************************************************")
        print("******* ir = %d, epoch=%d, batch_size=%d, lr=%.4f starting ***********"%(info[3], info[0],info[1],info[2])) # 超参设定
        print("***********************************************************************")
        Client.local_epoch = epoch
        Client.batch_size = batch_size
        Client.lr = lr
        for user_idx in range(num_users):
            clients.append(Client(dict_users[user_idx], Net(), user_idx, test_dataset))
        for i in range(num_users):
            print("clients[%d].num_data = "%(i), clients[i].num_data)
        server = Server(clients, test_dataset)
        server.fedlearn(cr, info)
        clients.clear()           
  
main()

***********************************************************************
******* ir = 1, epoch=2, batch_size=64, lr=0.0500 starting ***********
***********************************************************************
clients[0].num_data =  534
clients[1].num_data =  787
clients[2].num_data =  921
clients[3].num_data =  664
clients[4].num_data =  647
clients[5].num_data =  693
clients[6].num_data =  456
clients[7].num_data =  290
clients[8].num_data =  659
clients[9].num_data =  632
clients[10].num_data =  787
clients[11].num_data =  706
clients[12].num_data =  544
clients[13].num_data =  587
clients[14].num_data =  667
clients[15].num_data =  711
clients[16].num_data =  865
clients[17].num_data =  577
clients[18].num_data =  620
clients[19].num_data =  594
clients[20].num_data =  545
clients[21].num_data =  510
clients[22].num_data =  528
clients[23].num_data =  1263
clients[24].num_data =  600
clients[25].num_data =  633
clients[26].num_data =  718
clients[27].num_data =  1180
clients[28].num_data =  724
clients[29].num_data =  625
clients[30].num_data =  688
clients[31].num_data =  465
clients[32].num_data =  296
clients[33].num_data =  753
clients[34].num_data =  974
clients[35].num_data =  221
clients[36].num_data =  416
clients[37].num_data =  519
clients[38].num_data =  499
clients[39].num_data =  382
clients[40].num_data =  159
clients[41].num_data =  609
clients[42].num_data =  469
clients[43].num_data =  453
clients[44].num_data =  256
clients[45].num_data =  857
clients[46].num_data =  554
clients[47].num_data =  655
clients[48].num_data =  354
clients[49].num_data =  223
clients[50].num_data =  361
clients[51].num_data =  774
clients[52].num_data =  329
clients[53].num_data =  287
clients[54].num_data =  728
clients[55].num_data =  814
clients[56].num_data =  678
clients[57].num_data =  610
clients[58].num_data =  973
clients[59].num_data =  360
clients[60].num_data =  1262
clients[61].num_data =  680
clients[62].num_data =  464
clients[63].num_data =  698
clients[64].num_data =  778
clients[65].num_data =  609
clients[66].num_data =  498
clients[67].num_data =  704
clients[68].num_data =  212
clients[69].num_data =  95
clients[70].num_data =  563
clients[71].num_data =  802
clients[72].num_data =  805
clients[73].num_data =  589
clients[74].num_data =  698
clients[75].num_data =  439
clients[76].num_data =  542
clients[77].num_data =  362
clients[78].num_data =  1073
clients[79].num_data =  654
clients[80].num_data =  624
clients[81].num_data =  715
clients[82].num_data =  629
clients[83].num_data =  642
clients[84].num_data =  308
clients[85].num_data =  370
clients[86].num_data =  563
clients[87].num_data =  334
clients[88].num_data =  513
clients[89].num_data =  1024
clients[90].num_data =  640
clients[91].num_data =  349
clients[92].num_data =  742
clients[93].num_data =  443
clients[94].num_data =  782
clients[95].num_data =  881
clients[96].num_data =  453
clients[97].num_data =  354
clients[98].num_data =  617
clients[99].num_data =  507

Comm round 0: aggregated client 99    
 Test acc is  71.01
Comm round 1: aggregated client 99    
 Test acc is  83.05
Comm round 2: aggregated client 99    
 Test acc is  91.71
Comm round 3: aggregated client 99    
 Test acc is  91.13
Comm round 4: aggregated client 99    
 Test acc is  93.64
Comm round 5: aggregated client 99    
 Test acc is  93.88
Comm round 6: aggregated client 99    
 Test acc is  94.51
Comm round 7: aggregated client 99    
 Test acc is  94.78
Comm round 8: aggregated client 99    
 Test acc is  95.06
Comm round 9: aggregated client 99    
 Test acc is  95.26

如何使前五个客户端在本地训练呢

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

1条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
有问必答小助手 2021-11-30 09:45
关注
你好，我是有问必答小助手，非常抱歉，本次您提出的有问必答问题，技术专家团超时未为您做出解答

本次提问扣除的有问必答次数，将会以问答VIP体验卡（1次有问必答机会、商城购买实体图书享受95折优惠）的形式为您补发到账户。

因为有问必答VIP体验卡有效期仅有1天，您在需要使用的时候【私信】联系我，我会为您补发。

解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

hdfs为什么不适合存储小文件 hdfs 有问必答
2021-12-15 20:24

回答 1 已采纳为啥集群小文件治理那么重要，你真的懂吗？_涤生手记大数据-CSDN博客小文件是 Hadoop 的常见挑战，如果不小心处理，它们可能会导致
关于anaconda的pip3命令出错的问题 python 有问必答
2021-04-20 22:27

回答 3 已采纳参考下这个：https://blog.csdn.net/hardhard123/article/details/113251805
为什么我的FedEx包裹送达时没有收到通知？ php
2018-07-18 21:01

回答 2 已采纳 https://www.fedex.com/us/developer/WebHelp/ws/2014/dvg/WS_DVG_WebHelp/26_Shipment_Notification_in_
联邦学习【分布式机器学习技术】【①各客户端从服务器下载全局模型；②各客户端训练本地数据得到本地模型；③各客户端上传本地模型到中心服务器；④中心服务器接收各方数据后进行加权聚合操作，得全局模型】
2022-01-19 23:34

u013250861的博客随着计算机算力的提升，机器学习作为海量数据的分析处理技术，已经广泛...为了解决以上问题，谷歌提出联邦学习（FL，federated learning）技术，其通过将机器学习的数据存储和模型训练阶段转移至本地用户，仅与中心服务
如何使用python针对csv文件某一列进行结尾匹配并删除 list python 正则表达式
2021-05-29 22:30

回答 1 已采纳 1 用pandas读取文件 pd.read_csv() 2 筛选 data[~((data['A列']==10)&(data['F列'].str[-5:]=='..well'))]
联邦学习在视觉处理业务中的实践（下）
2022-04-07 12:02

武天旭的博客在实践中，中心化训练模式使得视觉的落地和部署面临许多困难和挑战，主要有以下影响因素： ● 数据隐私：视觉数据具有很强的隐私性，这些敏感数据通常不能被上传和使用。 ● 模型更新：由于网络性能和设备性能的差异...
【阅读笔记】联邦学习实战——联邦学习在智能物联网中的应用案例
2022-03-23 18:25

HERODING77的博客 联邦学习实战——联邦学习在智能物联网中的应用案例前言1. 案例背景与动机2. 历史数据分析3. 出行时间预测模型3.1 问题定义3.2 构造训练数据集3.3 模型结构4 联邦学习实现阅读总结前言 FATE是微众银行开发的联邦...
【文献阅读】联邦学习中设备的灵活参与
2022-12-14 22:47

晨曦未眠的博客 1 引言考虑到联邦学习通常需要数千个通信轮才能收敛，因此在实践中很难确保在整个训练过程中所有设备都可用。此外，通常有多个应用程序同时运行在用户设备上，竞争已经高度受限的硬件资源。因此，不能保证设备...
联邦学习加速方法
2022-04-20 19:18

武天旭的博客效率是指在保证模型性能不下降的前提下，有效提升联邦学习的训练效率，它是影响联邦学习落地的一个重要因素，其中模型计算和通信传输是影响联邦学习效率的主要原因。对应的，联邦学习效率优化主要就是从算法层面和...
联邦学习应用研究现状及发展趋势
2023-09-26 09:17

山科智能信息处理实验室的博客本文章主要参考第32届国际人工智能联合会议（IJCAI）上由清华大学人工智能研究院知识工程研究中心（KEG）、北京智谱华章科技有限公司、开放群岛开源社区联合编写的《2023联邦学习全球研究与应用趋势报告》，对重点...
联邦学习综述（二）——联邦学习的分类、框架及未来研究方向
2022-07-24 14:18

.别拖至春天.的博客前两章对联邦学习的定义并没有讨论如何具体地设计一种联邦学习的实施方案。在实际中，孤岛数据具有不同分布特点，根据这些特点，我们可以提出相对应的联邦学习方案。
[联邦学习TFF]构建自己的联邦学习模型
2022-09-13 21:27

一骑红尘荔枝来的博客 TFF 全称 tensorflow_federated，为谷歌的联邦学习框架。在TFF官网的界面中，介绍了如何尽可能多的利用现有的TensorFlow代码，构建一个TFF的模型。
ECCV 2022 | FedX: 在无监督联邦学习中进行知识蒸馏
2022-09-28 20:03

PaperWeekly的博客 ©PaperWeekly 原创 · 作者 | 张成蹊单位 | Freewheel机器学习工程师研究方向 | 自然语言处理论文的立意是在联邦学习过程中，结合对比学习，用局部与全局的两种蒸馏方式来无监督地学习样本的向量表示。FedX 不仅是...
基于联邦深度强化学习的无人驾驶决策与控制python源码+模型+超详细注释+项目说明.zip
2023-10-12 11:02

-client_agent_ddpg.py：客户端执行脚本，开启监听线程，用于根据通信指令进行模型的收发，并同时根据接收到的联邦模型在本地进行模型训练 conn文件夹：存放通信相关脚本的文件夹 - conn.py：通信相关的方法，包括...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
系统已结题 12月6日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 11月28日

悬赏问题

¥15 Windows server update services
¥15 关于#c语言#的问题：我现在在做一个墨水屏设计，2.9英寸的小屏怎么换4.2英寸大屏
¥15 模糊pid与pid仿真结果几乎一样
¥15 java的GUI的运用
¥15 Web.config连不上数据库
¥15 我想付费需要AKM公司DSP开发资料及相关开发。
¥15 怎么配置广告联盟瀑布流
¥15 Rstudio 保存代码闪退
¥20 win系统的PYQT程序生成的数据如何放入云服务器阿里云window版？
¥50 invest生境质量模块

如何在联邦学习中，使前五个客户端不参与联邦学习，而在自身本地训练呢

1条回答 默认 最新

问题事件

悬赏问题

1条回答默认最新