百科问答小站 logo
百科问答小站 font logo



如何评价 Face++ 旷视科技最新出品的检测专用 backbone 网络 DetNet ? 第1页

  

user avatar   skicy-yu 网友的相关建议: 
      

简单讲一下这篇文章的思路。

目前我们所有的检测算法大部分都是依赖于一个backbone网络,也就是传统大家说的ImageNet based model。但是ImageNet的base model往往是针对分类问题来train的,如果直接用来做detection/segmentation/skeleton等相关任务,其实是有比较明显的gap的。

最简单来讲,detection/segmentation等往往需要做pixel-level的定位,所以需要有尽可能大的feature map的spatial resolution。但是传统分类网络往往越卷越小,最后一个global average pool或者fc把所有spatial信息融合在一起,所以对空间信息的保存是非常不友好的。

传统大家做法是在ImageNet base model上面打补丁,比如加U-shape结构等。但是往往丢了的spatial很难被补回来。我们这篇工作希望是抛砖引玉,首先需要说明的是,我们在往这个方面努力,希望设计一个对detection/segmentation友好的网络,但是确实这个问题还是有许多需要改进的地方。

具体做法大家可以看paper细节。从结果上面来看,我们在只替换backbone网络的情况下,以更小的复杂度(少了近一倍)做到了更高的结果(超过一个多点)。无论是COCO的object detection还是instance segmentation上面,这个结果应该都是很impressive的。

最后,宣传一下我们最近的一些工作。

比如我们组去年做COCO skeleton第一的paper, 我们已经放出了完整的code

另外,我们之前的一个detection工作Light-head RCNN也放了code:




  

相关话题

  人工智能的爆发点究竟是在高校还是在企业? 
  目标检测该怎么学呀,目前研一,老师啥也不会,感觉毕不了业了? 
  科学技术的发展有没有可能建立一个人不需要工作也能良好生活的社会? 
  深度学习对图像的处理,为什么大多基于RGB,而没有其他色彩空间,比如HSV? 
  如何看待华为 4 月 25 日发布的盘古智能大模型?在这个行业处于什么水平? 
  为什么 Google 翻译只重算法不重语言学的语法结构和规则? 
  机器学习为生物学和医学研究带来了哪些改变?能解决哪些医学难题? 
  如何看待血肉苦弱,机械飞升? 
  当前人工智能特别是深度学习最前沿的研究方向是什么? 
  AI(或者说神经网络/深度学习)能够实现科学(尤其是物理学)研究中提出假设这一步嘛? 

前一个讨论
全世界目前最大威胁是什么?
下一个讨论
Mac 上使用 SSD 进行 Win To Go 的体验如何?





© 2024-12-25 - tinynew.org. All Rights Reserved.
© 2024-12-25 - tinynew.org. 保留所有权利