因为大多数paper报的baseline都是100epoch+[30 60 90] step learning schedule的setting,也就是fb复现resnet时用的setting,具体见https://github.com/facebookarchive/fb.resnet.torch。
nas出现以后大家开始用一些更牛逼的training setting来训练自己的网络了,跑几百个epoch,cosine learning schedule,label smooth,mixup,auto augmentation等等,所以resnet50的结果也越来越高,具体可参考https://arxiv.org/pdf/1812.01187.pdf。
后面还有distill,unlabeled data等一堆技巧,关注Quoc V. Le,你就能拥有一切。[doge]
本站所有内容均为互联网搜索引擎提供的公开搜索信息,本站不存储任何数据与内容,任何内容与数据均与本站无关,如有需要请联系相关搜索引擎包括但不限于百度,google,bing,sogou 等
© 2025 tinynews.org All Rights Reserved. 百科问答小站 版权所有