百科问答小站 logo
百科问答小站 font logo



如何评价谷歌提出的 Pix2Seq:将目标检测看成语言建模,效果超过 DETR? 第1页

  

user avatar   xiaohuzc 网友的相关建议: 
      

Transformer is only you need!

简单看了一下,挺吃惊的,没有想到目标检测还可以这样搞,而且效果看起来还行,把目标检测看成语言建模,也不需要啥花里胡哨的loss了。

一些开创性的工作都是谷歌做的,如Transformer,Bert,ViT。




  

相关话题

  现在机器学习工业界和学术界的差别越来越大了吗?尽早实习和踏实科研各有什么利弊? 
  未来十年,AI 将可能与哪些产业结合应用?产生怎样的价值? 
  如何看待Transformer在CV上的应用前景,未来有可能替代CNN吗? 
  要装修房子,有什么好用的智能设备推荐吗? 
  如何评价mixup: BEYOND EMPIRICAL RISK MINIMIZATION? 
  如何看待 Deepmind 宣称最新版 AlphaGo 能让李世乭版本 AlphaGo 三子? 
  2021年,作为算法工程师的你们会在CV业务落地上用Transformer吗? 
  《星际穿越》中的机器人违反过机器人定律吗? 
  如何看待“AI计算机视觉需求”推动了CIS传感器(CMOS Sensor)的快速迭代和市场增量? 
  你实践中学到的最重要的机器学习经验是什么? 

前一个讨论
主动学习(Active learning)算法的原理是什么,有哪些比较具体的应用?
下一个讨论
硕士方向,选择迁移学习还是自然语言处理?





© 2024-12-22 - tinynew.org. All Rights Reserved.
© 2024-12-22 - tinynew.org. 保留所有权利