百科问答小站 logo
百科问答小站 font logo



为啥gan里面几乎不用pooling? 第1页

  

user avatar   GordonQian 网友的相关建议: 
      

谈一下自己的理解。

ICLR16的DCGAN(arxiv.org/pdf/1511.0643)文章,里面的实验表明: 全卷积网络训练更稳定。

这个是有时代背景的,GAN(papers.nips.cc/paper/54) 14年刚被提出来的时候,loss function是有log函数的,这个log函数其实是个小bug,导致网络难以训练。详情点击【令人拍案叫绝的Wasserstein GAN】(zhuanlan.zhihu.com/p/25


因此14年未来两年的文章有许多是攻克GAN的训练难度问题。 DCGAN是其中之一。不过,自从ICML17的WGAN(arxiv.org/abs/1701.0787)被提出后,很大程度上解决了GAN的训练稳定性问题。

WGAN之后,也出现了许多影响力比较高的文章,并非用的全卷积网络,因为训练GAN并不是多大的问题了。比如ICLR18 Progressive Growing of GANs for Improved Quality, Stability, and Variation (arxiv.org/abs/1710.1019)(引用近1000,被认为第一篇具有高质量输出的GAN)就在D网络中用了average pooling. 再比如deep mind的bibiggan系列也并非是全卷积。

最近arxiv上也有文章指出,全卷积网络并不是最好的选择。FCCGAN(https://arxiv.org/pdf/1905.02417.pdf)还没看 ‍: )




  

相关话题

  为什么要压缩模型,而不是直接训练一个小的CNN? 
  怎么通过一维分布的随机样本推测原分布? 
  求通俗解释下bandit老虎机到底是个什么东西? 
  机器学习的算法和普通《算法导论》里的算法有什么本质上的异同? 
  深度学习如何入门? 
  在NLP上,CNN、RNN(认为LSTM等变体也是RNN)、最简单全连结MLP,三者相比,各有何优劣? 
  为什么现在的CNN模型都是在GoogleNet、VGGNet或者AlexNet上调整的? 
  如何看待华为 4 月 25 日发布的盘古智能大模型?在这个行业处于什么水平? 
  计算机视觉是否已经进入瓶颈期? 
  机器学习以及贝叶斯统计里,关于近似intractable integral,大家都偏爱什么算法? 

前一个讨论
如何评价 TGA 2019 年度游戏提名名单?
下一个讨论
随着各个领域越来越多的人都开始学习编程,计算机专业的人优势在哪里?





© 2025-02-01 - tinynew.org. All Rights Reserved.
© 2025-02-01 - tinynew.org. 保留所有权利