首页

如何评价 Face++ 旷视科技最新出品的检测专用 backbone 网络 DetNet ？第1页

1

skicy-yu 网友的相关建议:

简单讲一下这篇文章的思路。

目前我们所有的检测算法大部分都是依赖于一个backbone网络，也就是传统大家说的ImageNet based model。但是ImageNet的base model往往是针对分类问题来train的，如果直接用来做detection/segmentation/skeleton等相关任务，其实是有比较明显的gap的。

最简单来讲，detection/segmentation等往往需要做pixel-level的定位，所以需要有尽可能大的feature map的spatial resolution。但是传统分类网络往往越卷越小，最后一个global average pool或者fc把所有spatial信息融合在一起，所以对空间信息的保存是非常不友好的。

传统大家做法是在ImageNet base model上面打补丁，比如加U-shape结构等。但是往往丢了的spatial很难被补回来。我们这篇工作希望是抛砖引玉，首先需要说明的是，我们在往这个方面努力，希望设计一个对detection/segmentation友好的网络，但是确实这个问题还是有许多需要改进的地方。

具体做法大家可以看paper细节。从结果上面来看，我们在只替换backbone网络的情况下，以更小的复杂度（少了近一倍）做到了更高的结果（超过一个多点）。无论是COCO的object detection还是instance segmentation上面，这个结果应该都是很impressive的。

最后，宣传一下我们最近的一些工作。

比如我们组去年做COCO skeleton第一的paper, 我们已经放出了完整的code

另外，我们之前的一个detection工作Light-head RCNN也放了code:

如何评价 Face++ 旷视科技最新出品的检测专用 backbone 网络 DetNet ？的其他答案点击这里

1

相关话题

  AI领域的灌水之风如何破局？
  在你做推荐系统的过程中都遇到过什么坑？
  卷积神经网络中卷积核是如何学习到特征的？
  机器人同事越来越多，如何避免自己在科技进步过程中被替代？
  如何评价 Face++ 旷视科技最新出品的检测专用 backbone 网络 DetNet ？
  技术一旦被用来作恶，究竟会有多可怕？
  如何看待 DeepMind 论文宣称构建通用人工智能的所有技术已经具备？
  人类创造的最精巧的机器与人类本身的差距有多大？
  为什么要学习吴恩达的机器学习？
  如何评价b站up主图灵的猫关于tiktok的视频？

前一个讨论

全世界目前最大威胁是什么？

下一个讨论

Mac 上使用 SSD 进行 Win To Go 的体验如何？

相关的话题

  目前有哪些比较成功的人工智能应用？
  当前（2020年）机器学习中有哪些研究方向特别的坑？
  有监督和无监督学习都各有哪些有名的算法和深度学习？
  如果美国禁用 Tensorflow 和 Pytorch 对中国的人工智能有何影响？
  人们为什么这么害怕潘多拉之盒？
  为什么有些学数学的看不惯甚至鄙视 Deep Learning？
  如何评价 DeepMind 发表在 Nature 上的使用深度强化学习对托卡马克等离子体进行磁控制？
  LED/OLED 屏幕造价成本不断提升，激光电视会不会逐渐代替普通电视成为家庭影院的首选？
  字节跳动的发展潜力到底有多大，是否有可能超过BAT?
  对于多指标评价，BP神经网络评价和TOPSIS有什么区别呢？
  为什么AI算法工程师要求C++?
  如何看待Capsule Network在NLP领域的潜力？
  国内做NLP业务的香侬科技值得去吗？
  cv/nlp等方向的就业困难是全球性的吗？
  法律是否可能被代码化？
  AI 都学会看论文了，科研工作者会被淘汰么？
  如何评价野狐的国产围棋 AI「绝艺」？
  神经网络训练多个epoch，写论文的时候可以取最好的效果那一个epoch作为结果吗？
  如何看待 Google TPU？寒武纪芯片较之有哪些优势与不足？
  如何看待timm作者发布ResNet新基准：ResNet50提至80.4，这对后续研究会带来哪些影响？
  如何看待Tensor Comprehensions？与TVM有何异同？
  如何评价Google发布的第二代深度学习系统TensorFlow?
  如何评价李飞飞和李佳加盟谷歌？
  计算成像(computational photography)方向的就业前景如何？
  控制的未来在哪里？
  怎样让机器有意识?
  成长型企业如何灵活、高效、全方位地实现数字化转型？
  如何评价FAIR提出的MaskFeat：一种适用图像和视频分类的自监督学习方法？
  使用强化学习解决实际问题时常常避不开环境模拟或者使用离线强化学习算法，两者分别有什么优缺点？
  我应该从计算机视觉回到做FPGA 吗？

© 2025-06-21 - tinynew.org. All Rights Reserved.
© 2025-06-21 - tinynew.org. 保留所有权利