首页

如何评价 MSRA 最新的 Deformable Convolutional Networks？第1页

1

tang-xu-60-83 网友的相关建议:

蹲个马桶的功夫来总结下这篇论文。

目前已有的三篇讲这篇deformable convolution network的文章：

1.

http:// mp.weixin.qq.com/s/OETZ 8rYC8AuR75nAVa-KNw

2.

http:// mp.weixin.qq.com/s/Ulu8 Kw4FDty-dMOu7qNxxQ

3.

http:// mp.weixin.qq.com/s/okI3 MT3E2o2PKCeokE7Niw

一如既往的Jifeng Dai的work，继承了STN，刚花了一个下午看完这篇论文，很novel的工作，共同作者是msra的实习生们。

第一篇文章有句很生动的概括：“文章通俗的说法就是，图片中的物体形状本来就是千奇百怪，方框型的卷积核，即使卷积多次反卷积回去仍然是方框，不能真实表达物体的形状，如果卷积核的形状是可以变化的，这样卷积后反卷积回去就可以形成一个物体真实的多边形，更贴切的表达物体形状，从而可以更好的进行像素分割和物体检测。”

这张图可以很明显看出方法的有效性，每个三列的图中，左边是背景上的点对应的激活它的点（感受野），可以看出是覆盖天空的背景的。中间一列对应的是小物体，反向回去对应的激活点是几乎覆盖小物体上所有区域，同理右边那列对应大物体。

几个值得注意的地方：

1. 2.3一开头那几句讲解如何初始化deformable的部分。

2.主要是在一些detection和segmentation的task上取得了进步。后续关于分类任务的应用值得展望。

3.Learning the offset部分讲述了offset的学习过程的细节。

yuwen-xiong 网友的相关建议:

冒个泡，一个半月以后终于把code release出来了，放在了

msracver/Deformable-ConvNets

，当时做实验用的是内部的只能在Windows上跑的支持多卡做detection的Caffe，基本没法release，花了一个多月迁移到了MXNet上。其实我们的实现跟现有的repo并不太一样，欢迎大家来围观。

如何评价 MSRA 最新的 Deformable Convolutional Networks？的其他答案点击这里

1

相关话题

  多任务学习成功的原因是引入了别的数据库还是多任务框架本身呢？
  adversarial training为什么会起作用？
  为什么这么多 NLP 大牛硕士毕业去企业不留在学术界？
  如何诠释「懂你」？
  无人车为什么一定要用激光雷达做，双目视觉难道不行吗？
  你有哪些deep learning（rnn、cnn）调参的经验？
  上学和读书有什么区别?
  如何看待阿里巴巴成立全球研究院“达摩院” 引入顶尖科学家3年研发投入1000亿？
  CVPR2022 有什么值得关注的论文 ?
  如何看待语音合成等 AI 算法、无人机等被列入限制出口技术目录？

前一个讨论

为什么 Non-Convex Optimization 受到了越来越大的关注？

下一个讨论

如何看待Yoav Goldberg 怒怼来自MILA的GAN for NLG的paper?

相关的话题

  如何评价旷视开源的YOLOX，效果超过YOLOv5?
  一个人能否实现自己转动螺旋桨从而上天？实现需要什么条件？
  如何评价Hinton在加拿大多伦多大学关于用“capsule”作为下一代CNN的演讲？
  人工智能在哪些领域还落后于人类？
  Pytorch有什么节省显存的小技巧？
  大家都是在哪些网站找数据？
  电子游戏要发展到什么时候，玩家才可以直接通过打字或者语音的方式与NPC对话？
  怎么选取训练神经网络时的Batch size?
  如何看待Hinton的论文《Dynamic Routing Between Capsules》？
  如何评价Yann LeCun宣称『他已经做好放弃概率论的准备』？
  如何评价 MSRA 最新的 Deformable Convolutional Networks？
  国内的自动驾驶技术目前发展到什么阶段了？
  人类对人工智能的不信任源自何处？应当理解为文明间的冲突抑或是物种间的对立？
  机器人同事越来越多，如何避免自己在科技进步过程中被替代？
  深度学习中Attention与全连接层的区别何在？
  应届硕士毕业生如何拿到知名互联网公司算法岗（机器学习、数据挖掘、深度学习） offer？
  如何看待人工智能用于配音？
  如何评价阿里巴巴推出的智能音箱「天猫精灵 X1」？
  卷积神经网络中卷积核是如何学习到特征的？
  能否把一个人的所有物理数据输入在一个模型里，然后计算他接下来的状态变化？
  为什么现在的CNN模型都是在GoogleNet、VGGNet或者AlexNet上调整的？
  如何看待大热的人工智能机器人 Sophia？
  有什么深度学习数学基础书推荐？
  为什么VAE-GAN的训练很容易发生梯度爆炸，如何避免？
  AI 自己不会思考，为什么叫做人工智能？
  能否对卷积神经网络工作原理做一个直观的解释？
  如何看待FAIR提出的8-bit optimizer：效果和32-bit optimizer相当？
  为什么很少拿神经网络来直接做滤波器呢？
  如何评价微软新出的自拍软件 Microsoft Selfie？
  如何评价 Google 在 2022 年 3 月公开的 Pathways 架构设计？

© 2025-05-10 - tinynew.org. All Rights Reserved.
© 2025-05-10 - tinynew.org. 保留所有权利