首页

机器学习小白来提问：关于联邦学习FedAVG和FedSGD的问题？第1页

1

felix_zlf 网友的相关建议:

参考FedSGD和FedAVG的原始论文《Federated Learning of Deep Networks using Model Averaging》中的一段话：

To apply this approach in the federated setting, we select a C-fraction of clients on each round, and compute the gradient of the loss over all the data held by these clients. Thus, C controls the global batch size, with C = 1 corresponding to full-batch (non-stochastic) gradient descent.2 We refer to this baseline algorithm as FederatedSGD (or FedSGD).

FedSGD：每次采用client的所有数据集进行训练，本地训练次数为1，然后进行aggregation。

C：the fraction of clients that perform computation on each round

每次参与联邦聚合的clients数量占client总数的比例。C=1 代表所有成员参与聚合

B：the local minibatch size used for the client updates.

client的本地的训练的batchsize

E：then number of training passes each client makes over its local dataset on each round

两次联邦训练之间的本地训练的次数

综上所述，C=E=1 ，B=∞时，FedAvg等价于FedSGD，FedSGD是特殊形式的FedAVG，与采用什么优化器没有关系。

机器学习小白来提问：关于联邦学习FedAVG和FedSGD的问题？的其他答案点击这里

1

相关话题

  如何用一句话证明自然语言处理很难？
  计算机视觉顶级会议论文中比较适合初学计算机视觉的人做的复现实验有哪些？
  是不是并不是所有问题都适合用神经网络预测？
  Java对于int变量a，如何以最快速度计算34*a?
  到了 2022 年，人工智能有哪些真正可落地的应用？
  人工智能的意义和价值是什么？
  CNN（卷积神经网络）、RNN（循环神经网络）、DNN（深度神经网络）的内部网络结构有什么区别？
  如何看待淘宝、微信、抖音推出算法关闭键？会带来哪些影响？还有哪些问题值得关注？
  如何评价 Exploring Simple Siamese Learning?
  如何评价MSRA视觉组最新对spatial attention mechanism分析论文？

前一个讨论

我对多普勒效应不太理解，大家可以教教我吗？

下一个讨论

K-means聚类算法中的K如何确定？

相关的话题

  C++笔试算法题允许用stl函数吗？
  使用强化学习解决实际问题时常常避不开环境模拟或者使用离线强化学习算法，两者分别有什么优缺点？
  在机器学习模型的训练期间，大概几十分钟到几小时不等，大家都会在等实验的时候做什么？
  为什么 Non-Convex Optimization 受到了越来越大的关注？
  Resnet到底在解决一个什么问题呢？
  深度神经网络（DNN）是否模拟了人类大脑皮层结构？
  如何看待鄂维南院士等发起的机器学习联合研讨计划（c2sml.cn）？
  机器学习中macro-F1的计算公式？
  机器学习在理论经济学研究中有哪些可能的应用前景？
  算法工程师如何应对做算法策略的不确定性；比如没效果，这时绩效怎么保证？
  将并行计算纳入算法竞赛，是否合适？
  如何评价 DeepMind 在星际中的失利，以及 OpenAI 在 Dota 上的成功？
  推荐系统有什么危害?
  失传的缀数法最有可能是什么方法？
  这张算数入门图（一只兔子加一只兔子）里的题在算什么？
  深度学习调参有哪些技巧？
  为什么我用相同的模型，数据，超参，随机种子，在两台服务器会得到不同的结果？
  如何评价移动端吊打一切万众期待的商汤深度学习推理框架PPL开源了却没有支持移动端？
  为什么谈论深度学习工具时，很少有人讨论matlab的神经网络工具包？
  为什么ViT里的image patch要设计成不重叠？
  经过足够长的时间， AlphaGo 的棋谱能收敛到一张上吗？
  机器学习的算法和普通《算法导论》里的算法有什么本质上的异同？
  ICLR 2018 有什么值得关注的亮点？
  时间序列和回归分析有什么本质区别？
  如何看待Yoav Goldberg 怒怼来自MILA的GAN for NLG的paper?
  熵权法确定权重的原理是不是因为它仅依赖于数据本身的离散性?
  计算复杂性理论是否具有足够的现实意义，如今有哪些比较「现实」的应用？
  如果你是面试官，你怎么去判断一个面试者的深度学习水平？
  深度学习中有哪些数据增强方法？
  自监督学习（Self-supervised Learning）有什么比较新的思路？

© 2025-06-20 - tinynew.org. All Rights Reserved.
© 2025-06-20 - tinynew.org. 保留所有权利