首页

如何评价 MSRA 最新的 Deformable Convolutional Networks？第1页

1

tang-xu-60-83 网友的相关建议:

蹲个马桶的功夫来总结下这篇论文。

目前已有的三篇讲这篇deformable convolution network的文章：

1.

http:// mp.weixin.qq.com/s/OETZ 8rYC8AuR75nAVa-KNw

2.

http:// mp.weixin.qq.com/s/Ulu8 Kw4FDty-dMOu7qNxxQ

3.

http:// mp.weixin.qq.com/s/okI3 MT3E2o2PKCeokE7Niw

一如既往的Jifeng Dai的work，继承了STN，刚花了一个下午看完这篇论文，很novel的工作，共同作者是msra的实习生们。

第一篇文章有句很生动的概括：“文章通俗的说法就是，图片中的物体形状本来就是千奇百怪，方框型的卷积核，即使卷积多次反卷积回去仍然是方框，不能真实表达物体的形状，如果卷积核的形状是可以变化的，这样卷积后反卷积回去就可以形成一个物体真实的多边形，更贴切的表达物体形状，从而可以更好的进行像素分割和物体检测。”

这张图可以很明显看出方法的有效性，每个三列的图中，左边是背景上的点对应的激活它的点（感受野），可以看出是覆盖天空的背景的。中间一列对应的是小物体，反向回去对应的激活点是几乎覆盖小物体上所有区域，同理右边那列对应大物体。

几个值得注意的地方：

1. 2.3一开头那几句讲解如何初始化deformable的部分。

2.主要是在一些detection和segmentation的task上取得了进步。后续关于分类任务的应用值得展望。

3.Learning the offset部分讲述了offset的学习过程的细节。

yuwen-xiong 网友的相关建议:

冒个泡，一个半月以后终于把code release出来了，放在了

msracver/Deformable-ConvNets

，当时做实验用的是内部的只能在Windows上跑的支持多卡做detection的Caffe，基本没法release，花了一个多月迁移到了MXNet上。其实我们的实现跟现有的repo并不太一样，欢迎大家来围观。

如何评价 MSRA 最新的 Deformable Convolutional Networks？的其他答案点击这里

1

相关话题

  如果智能机器人真的大批量取代人工，那真的会失业么？
  如何看待华米科技 2018 年度新品发布会？
  如何评价基于游戏毁灭战士（Doom）的AI死亡竞赛大赛结果？
  如何评价谷歌大脑的EfficientNet？
  如何评价AWS的图神经网络框架DGL？
  请问DeepMind和OpenAI身后的两大RL流派有什么具体的区别？
  如何评价FAIR提出的ConvNeXt：CNN匹敌Swin Transformer?
  李彦宏夫妇向北大捐赠 6.6 亿元用于前沿学术研究，将产生哪些影响？
  机器视觉为什么不用手机的镜头，而要用那么大的工业相机？
  人工智能时代的价值创造：如何看待无人工厂、无人车间与劳动价值论的“矛盾”？

前一个讨论

为什么 Non-Convex Optimization 受到了越来越大的关注？

下一个讨论

如何看待Yoav Goldberg 怒怼来自MILA的GAN for NLG的paper?

相关的话题

  如何看待阿里巴巴成立阿里全球研究院「达摩院」，3 年投资 1000 亿引进顶级人才？
  弟弟估分能上清北，选人工智能还是网络新媒体（新闻传播类）专业？
  能否使用神经网络来判断奇偶数？
  自动驾驶能治首堵病吗？
  学习两年多，感觉SLAM太难了，大家对此有什么想法？
  A*寻路是一种广度优先搜索？
  有监督和无监督学习都各有哪些有名的算法和深度学习？
  日本“妻子机器人"上市，不要彩礼不要车房，大家怎么看待现实女性与机器女性？
  attention跟一维卷积的区别是啥？
  你遇见过什么当时很有潜力但是最终没有流行的深度学习算法?
  自然语言处理怎么最快入门？
  我们处于人工智能的时代，还是人工智障的时代？
  迁移学习与fine-tuning有什么区别？
  研一刚入学，从未接触过神经网络，python也是才开始学，现在导师要我做LSTM，我应该去学什么？
  如何看待AI参与文学创作？
  一个无监督学习算法，如何判断其好坏呢?
  机器学习里面的流形都是怎么用的？
  如何看待谷歌公开 tensorflow 专用处理器 TPU?
  Google 的神经网络生成图像 (Inceptionism) 是怎么做到的？
  Evidential deep learning里一般怎么估计多标签分类的Uncertainty？
  全连接层的作用是什么？
  如何评价浪潮发布的2457亿参数源1.0智能大模型？与GPT-3相比如何？处于AI模型领域什么水平？
  人工智能退潮期来了吗？
  假如核弹是人类打开的第一个潘多拉魔盒，那么下一个会是什么？
  劳荣枝二十年后被抓，容貌和20年前变化很大，警方是怎么判定她是劳荣枝的？
  如何看待网传依图科技集体降薪 10% 以上？还有哪些信息值得关注？
  现在机器学习工业界和学术界的差别越来越大了吗？尽早实习和踏实科研各有什么利弊？
  如何评价微软亚研院提出的把 Transformer 提升到了 1000 层的 DeepNet？
  如何看待 AI 换脸软件「ZAO」的爆火？
  神经网络，分类和回归问题，在网络结构上的区别是什么？分类比回归多一层softmax吗？诚心求教？

© 2025-06-01 - tinynew.org. All Rights Reserved.
© 2025-06-01 - tinynew.org. 保留所有权利