首页

如何评价MSRA视觉组最新对spatial attention mechanism分析论文？第1页

1

li-xia-zhi-guang 网友的相关建议:

很钦佩的一篇文章，一统地将多个思路总结在一个框架下。

将self-attention计算所用的factor总结为四种：

query and key content
query content and relative position
key content only
relative position only

其实回顾来看，在近两年的CV文章里，每个factor都有成功的范例。factor 1 最经典的文章就是Non-local^[1]；factor 2 有PSANet^[2]；GCNet归属到factor 3^[3]；至于factor 4，Local Relation Network^[4]中的Geometry Prior可以算作范例。

当然，self-attention在CV的应用中，还有A2Net^[5]、Local Relation Net^[4]这两种范式。不过目前来看，CV里self-attention相关的文章，都抛不开如上计算形式（拍脑袋总结，求打脸）。

所以呢，如果看到一篇新的文章声称自己propose了一种全新的attention机制，并创造出一整套的全新的术语来描述，那么我们不妨如下简单地两步走：1. 是否是上述六种计算形式；2. 如果是，形式上有没有真正的创新。如果满足1不满足2，那么就不要被其花哨的写作唬住了。

参考

如何评价MSRA视觉组最新对spatial attention mechanism分析论文？的其他答案点击这里

1

相关话题

  有什么算法能对一个长短不一的时间序列进行分类预测?
  硕士方向，选择迁移学习还是自然语言处理？
  R 中的哪些命令或者包让你相见恨晚？
  《人工智能训练师国家职业技能标准》发布，有哪些值得关注的信息？
  如何评价 DeepMind 的新工作 AlphaCode?
  机器学习以及贝叶斯统计里，关于近似intractable integral，大家都偏爱什么算法？
  从今年校招来看，机器学习等算法岗位应届生超多，竞争激烈，未来 3-5 年机器学习相关就业会达到饱和吗？
  如何看待在某度搜不到megengine官网？
  现在tensorflow和mxnet很火，是否还有必要学习scikit-learn等框架？
  如何评价FAIR提出的MaskFeat：一种适用图像和视频分类的自监督学习方法？

前一个讨论

既然使用神经网络也可以解决分类问题，那SVM、决策树这些算法还有什么意义呢？

下一个讨论

重庆被外界高估了吗？

相关的话题

  如何评价微软提出的无监督视觉模型BEiT：ImageNet达到88.6，ADE20K达到57.0？
  如何看待 Google 既可以作 Inference，又可以作 Training 的新一代 TPU？
  现在的人工智能是否走上了数学的极端？
  为什么新增特征有时候会对模型带来负面影响？
  到了 2022 年，人工智能有哪些真正可落地的应用？
  什么是蒙特卡罗 Dropout(Monte-Carlo Dropout)？
  如何评价AWS的图神经网络框架DGL？
  基于大数据的个人信用体系有没有可能被滥用？
  深度学习（机器学习）的下一步如何发展？
  有什么深度学习数学基础书推荐？
  如何评价周志华教授新提出的 Deep Forest 模型，它会取代当前火热的深度学习 DNN 吗？
  人脸识别进小区合法吗？为什么要用人脸识别？
  如何看待swin transformer成为ICCV2021的 best paper？
  NLP文本分类的本质是不是其实是找相似，对于要分类的句子，在训练集里找最相似的句子？
  如何看待比 iPad 还大的史上最大芯片问世？功耗比电磁炉还高有什么用？
  2022 年人工智能领域的发展趋势是什么？你都有哪些期待？
  面试官如何判断面试者的机器学习水平？
  如何理解深度学习中的deconvolution networks？
  有没有根据一张人物的立绘正面像，自动生成同风格各侧面角度像并自动衍生表情的软件啊？
  做底层 AI 框架和做上层 AI 应用，哪个对自己的学术水平（或综合能力）促进更大？
  Python 如何画出漂亮的地图？
  如何看待 Richard Sutton 说的「人工智能中利用算力才是王道」？
  有哪些关于机器学习的真相还鲜为人知？
  知识图谱+nlp，有什么适合硕士独自研究的方向？
  如何评价基于游戏毁灭战士（Doom）的AI死亡竞赛大赛结果？
  能否训练一个AI模型来预测房价，寻找投资机会挖掘价值洼地？
  深度学习方面的科研工作中的实验代码有什么规范和写作技巧？如何妥善管理实验数据？
  wasserstein 距离的问题?
  如何用自然语言处理判断一句话是否符合中文口语习惯？
  NLP 中 prompt learning 有哪些可能的天生缺陷？目前有什么样的方法来解决这样的缺陷？

© 2025-04-14 - tinynew.org. All Rights Reserved.
© 2025-04-14 - tinynew.org. 保留所有权利