首页

如何计算CNN中batch normalization的计算复杂度（FLOPs）？第1页

1

quarrying 网友的相关建议:

下面分析在推理 (或者说测试) 时 BN 层的计算量:

设是BN层的输入, 其尺寸为 ; 是BN层的moving mean, 是BN层的moving variance, 是BN层的scale, 是BN层的shift, 它们的尺寸均为 . 为了简化推导, 设 , 并令 , , , , , . 则BN层的输出的第k个通道为:

, 式中是全1矩阵(而不是单位矩阵), 是一个很小的正数, 防止除零的发生.

令 , 则 . 由于都是已知的, 和可以预先计算 (NCNN中就是这样做的^[1]), 在推理时不会占用额外的计算时间, 于是的计算量只有次乘法运算和次加法运算, 对于C个通道计算量则有次乘法运算和次加法运算. 这个计算量相对于一般卷积层的计算量是很小的. 对于一般卷积则需要次乘法运算, 次加法运算(有偏置项) 或次加法运算(无偏置项), 这些符号可以顾名思义, 这里就不赘述了, 详细的推导可以参考^[2].

另外如果网络采用Conv-BN-ReLU的设置, 则BN的参数还可以折叠 (fold) 到前面的卷积层的参数中, 这时BN的计算被包含到卷积的计算中了.

参考

如何计算CNN中batch normalization的计算复杂度（FLOPs）？的其他答案点击这里

1

相关话题

  如何评价Deepmind自监督新作BYOL？
  Batch Normalization 训练的时候为什么不使用 moving statistics？
  深度学习和强化学习之间的差别有多大？
  深度学习的多个loss如何平衡？
  CVPR 2018 有什么值得关注的亮点？
  神经网络中如果一个重要特征C等于特征A+特征B（算数意义上的相加），选特征的时候还有必要选特征C吗?
  如何评价中科大实现了媲美人脑能效的类脑突触原型器件？
  如何评价mixup: BEYOND EMPIRICAL RISK MINIMIZATION？
  深度学习（机器学习）的下一步如何发展？
  机器学习中有哪些形式简单却很巧妙的idea？

前一个讨论

CPU和GPU跑深度学习差别有多大？

下一个讨论

2020年CVPR有哪些优秀的论文？

相关的话题

  百度在深度学习上使用Xilinx FPGA?
  如何评价清华大学发布的自研深度学习框架-计图(Jittor)？
  如何评价Deepmind自监督新作BYOL？
  CPU和GPU跑深度学习差别有多大？
  如何评价Facebook AI提出的ResMLP，对比Google的MLP-Mixer?
  如何看待 TI7 上与 Dendi solo 的 OpenAI？
  如何理解 inductive learning 与 transductive learning?
  如何看待知乎的AI答主「四十二」？人工智能有可能理解生命的意义是什么吗？
  如何评价MSRA最新的 Relation Networks for Object Detection？
  在算力充沛，深度学习模型大行其道的今天，传统机器学习的未来在哪里？
  消融实验是什么？
  如何理解MCMC中的细致平稳条件？
  如何评价 DeepMind 新提出的关系网络（Relation Network）？
  如何评价CVPR2019程序主席Derek Hoiem的论点：计算机视觉只是记忆，不是智能？
  是不是并不是所有问题都适合用神经网络预测？
  如何看待Meta（恺明）最新论文ViTDet：只用ViT做backbone（不使用FPN）的检测模型？
  怎样让机器有意识?
  行人轨迹预测有哪些有效的方法和普遍的base方法？或者public dataset?
  请解释下variational inference？
  word2vec有什么应用？
  NIPS 2018 有什么值得关注的亮点？
  如何评价 DeepMind 的新工作 AlphaCode?
  深度学习有哪些好玩的案例？
  如何评价深度学习相关顶级期刊论文难复现的问题？
  Resnet到底在解决一个什么问题呢？
  nlp有哪些值得完整实现一遍的算法?
  如何评价 MSRA 视觉组最新提出的 Deformable ConvNets V2？
  为何感觉“知识蒸馏”这几年没有什么成果？
  如何把梯度传递过Argmax?
  2017年1月18日Facebook发行的PyTorch相比TensorFlow、MXNet有何优势？

© 2025-05-22 - tinynew.org. All Rights Reserved.
© 2025-05-22 - tinynew.org. 保留所有权利