首页

为什么yolov5从零开始训练（不在ImageNet上预训练）能够达到如此高的性能？第1页

1

na-tiao-mei-you-ren-de-jie 网友的相关建议:

1.大量的数据增强：颜色变换，仿射变换，mosaic等；

2.增加正样本的方法，邻域匹配的思想，以前yolo系列都是单个网格产生落在该网格的目标，现在有上、下、左、右（根据中心点位置选择2个）和中间网格对该目标进行预测，正样本数量大大增加，所以整体训练收敛比较快；

3.形状shape对正样本选择；

4.邻域匹配的思想改变了xy的编解码，正样本选择的基础上改变了wh的编解码，原来是e指数乘anchor，现在是sigmoid乘上anchor；

5.loss方面：obj loss，giou / ciou loss，不同特征图上的iou loss权重大小，focal loss等；

6.训练方面：ema，warmup，余弦学习率衰减，超参搜索等；

7.网络结构方面等。

为什么yolov5从零开始训练（不在ImageNet上预训练）能够达到如此高的性能？的其他答案点击这里

1

相关话题

  在实际工程系统中，MPC太复杂，难以做到realtime。因此都利用数据，MPC对比RL还有优势么?
  人工智能可以为人类找寻他们心目中的另一半吗?
  2018年了，MXNet 发展的如何了？
  2021 年了，TensorFlow 和 PyTorch 两个深度学习框架地位又有什么变化吗？
  如何计算CNN中batch normalization的计算复杂度（FLOPs）？
  小狗吃东西的时候脾气很不好？
  如何证明数据增强（Data Augmentation）有效性？
  为什么softmax很少会出现[0.5，0.5]？
  如何评价FAIR提出的MaskFeat：一种适用图像和视频分类的自监督学习方法？
  word2vec有什么应用？

前一个讨论

为什么很多年轻人不愿意回家过年？「过年焦虑」究竟在焦虑什么？

下一个讨论

为什么图形学的会议siggraph的论文代码很少会开源？好像视觉如CVPR、ICCV开源的更多一些。

相关的话题

  2022 年初，你认为哪项成果代表了现在人工智能的最高水平？
  大家用resnet50在imagenet上面top1最高能到多少？
  计算机视觉研一，只学过Python基础，目前代码能力很差，要不要换导师，不换的话如何毕业？
  深度学习中有哪些数据增强方法？
  TensorFlow的自动求导具体是在哪部分代码里实现的？
  为什么读论文最好打印出来读？
  训练过程中loss震荡特别严重，可能是什么问题？
  目标检测算法中Two-stage算法速度慢,到底在哪里?
  全连接层的作用是什么？
  计算机视觉和自然语言处理，哪个更具有发展前景呢，还是各有千秋呢？
  FPGA做深度学习能走多远？
  新智元提问：如何看待李飞飞高徒Karpathy加入特斯拉，主管人工智能部门？
  下一代 AI 框架长什么样？
  如何比较Keras, TensorLayer, TFLearn ？
  现在互联网公司还有做特征工程的工作吗？
  为什么要压缩模型，而不是直接训练一个小的CNN？
  北京深鉴科技基于FPGA平台的DPU架构如何？
  NTIRE2017夺冠的EDSR去掉了Batch Normalization层就获得了提高为什么？
  如何评价MSRA最新的 Relation Networks for Object Detection？
  机器学习中有哪些形式简单却很巧妙的idea？
  机器学习，深度神经网络等方法是否是正确的方向？
  贝叶斯深度学习是什么，和传统神经网络有何不同？
  人工智能可以解决人类难题吗？
  除了深度学习，机器学习领域近年来还有什么热点吗？
  人工智能可以解决人类难题吗？
  为啥gan里面几乎不用pooling？
  目标检测算法中Two-stage算法速度慢,到底在哪里?
  实体提取任务中使用BERT-CRF时，CRF根据数据统计可以得到转移概率，为啥还要训练呢？
  如何理解今年发表在JMLR上随机森林算法SPORF？
  新手如何入门pytorch？

© 2025-05-12 - tinynew.org. All Rights Reserved.
© 2025-05-12 - tinynew.org. 保留所有权利