首页

为什么yolov5从零开始训练（不在ImageNet上预训练）能够达到如此高的性能？第1页

1

na-tiao-mei-you-ren-de-jie 网友的相关建议:

1.大量的数据增强：颜色变换，仿射变换，mosaic等；

2.增加正样本的方法，邻域匹配的思想，以前yolo系列都是单个网格产生落在该网格的目标，现在有上、下、左、右（根据中心点位置选择2个）和中间网格对该目标进行预测，正样本数量大大增加，所以整体训练收敛比较快；

3.形状shape对正样本选择；

4.邻域匹配的思想改变了xy的编解码，正样本选择的基础上改变了wh的编解码，原来是e指数乘anchor，现在是sigmoid乘上anchor；

5.loss方面：obj loss，giou / ciou loss，不同特征图上的iou loss权重大小，focal loss等；

6.训练方面：ema，warmup，余弦学习率衰减，超参搜索等；

7.网络结构方面等。

为什么yolov5从零开始训练（不在ImageNet上预训练）能够达到如此高的性能？的其他答案点击这里

1

相关话题

  400如何训练能到二级?
  2017年1月18日Facebook发行的PyTorch相比TensorFlow、MXNet有何优势？
  如何看待在某度搜不到megengine官网？
  深度学习和强化学习之间的差别有多大？
  能否对卷积神经网络工作原理做一个直观的解释？
  scikit-learn, tensorflow, pytorch真的只需要查下API，不需要学吗?
  为什么我用相同的模型，数据，超参，随机种子，在两台服务器会得到不同的结果？
  是不是并不是所有问题都适合用神经网络预测？
  pytorch 分布式计算你们都遇到过哪些坑/bug？
  如何评价微软提出的无监督视觉模型BEiT：ImageNet达到88.6，ADE20K达到57.0？

前一个讨论

为什么很多年轻人不愿意回家过年？「过年焦虑」究竟在焦虑什么？

下一个讨论

为什么图形学的会议siggraph的论文代码很少会开源？好像视觉如CVPR、ICCV开源的更多一些。

相关的话题

  强化学习和自适应控制的关系是什么？
  如何看待华为 4 月 25 日发布的盘古智能大模型？在这个行业处于什么水平？
  如何看待Jeff Dean&Hinton投到ICLR17的MoE的工作？
  CVPR 2019 有哪些值得关注的亮点？
  人工智能相关的岗位薪酬状况如何？
  请问手指训练饼和指力器对初学钢琴有好处吗?
  关于tensorflow中的滑动平均？
  为什么现在有这么多人工智能无用论？
  人是如何做黑盒优化的？
  在推荐系统中，如何较好的采用深度学习方法获取用户长短期兴趣？
  类似AlphaGo一样的人工智能什么时候才可以击败RTS（如星际）顶级选手？
  中国和美国谁能成人工智能领域的领军者？
  如何评价剑桥，腾讯， DeepMind以及港大团队新作 SimCTG ?
  一个完整的Pytorch深度学习项目代码，项目结构是怎样的？
  CVPR 2019 有哪些值得关注的亮点？
  nlp有哪些值得完整实现一遍的算法?
  如何评价陈天奇的模块化深度学习系统NNVM？
  视觉算法的工业部署及落地方面的技术知识，怎么学？
  深度学习的多个loss如何平衡？
  如何评价何恺明等 arxiv 新作 Rethinking ImageNet Pre-training？
  为什么在SGD中使用L1正则化很难获得稀疏性？
  OpenCV已经将图像处理(识别)的算法写成函数了,那我们还有必要去学习这些算法不?
  一个完整的Pytorch深度学习项目代码，项目结构是怎样的？
  如何理解深度学习中的deconvolution networks？
  2021年，ncnn发展的如何了？
  如何评价 DeepMind 新提出的关系网络（Relation Network）？
  CNN（卷积神经网络）、RNN（循环神经网络）、DNN（深度神经网络）的内部网络结构有什么区别？
  BERT中，multi-head 768*64*12与直接使用768*768矩阵统一计算，有什么区别？
  大牛Bengio 团队最新的研究和我自己之前的研究成果重复了，应该怎么办？
  视频中的目标检测与图像中的目标检测具体有什么区别？

© 2025-06-23 - tinynew.org. All Rights Reserved.
© 2025-06-23 - tinynew.org. 保留所有权利