百科问答小站 logo
百科问答小站 font logo



如何评价谷歌提出的 Pix2Seq:将目标检测看成语言建模,效果超过 DETR? 第1页

  

user avatar   xiaohuzc 网友的相关建议: 
      

Transformer is only you need!

简单看了一下,挺吃惊的,没有想到目标检测还可以这样搞,而且效果看起来还行,把目标检测看成语言建模,也不需要啥花里胡哨的loss了。

一些开创性的工作都是谷歌做的,如Transformer,Bert,ViT。




  

相关话题

  如何评价ST-GCN动作识别算法? 
  人工智能会是泡沫吗? 
  怎么看待英国莱斯特大学副校长拟裁撤整个数学系以补贴 AI、计算机、量子科技等研究领域? 
  如何看待 24 岁北航博士侯涛刚毕业后受聘北京交通大学副教授? 
  如何看待谷歌 Jeff Dean 用 AI 6 小时就能设计一款芯片,强力碾压集成电路设计专家? 
  如何看待血肉苦弱,机械飞升? 
  现大二,准备做大学生创新创业项目计划 ,目前定的方向是深度学习+畜牧业/养殖业,有什么建议给我们吗? 
  人工智能相关的岗位薪酬状况如何? 
  深度学习在无人驾驶汽车上面的运用有哪些? 
  神经网络训练多个epoch,写论文的时候可以取最好的效果那一个epoch作为结果吗? 

前一个讨论
主动学习(Active learning)算法的原理是什么,有哪些比较具体的应用?
下一个讨论
硕士方向,选择迁移学习还是自然语言处理?





© 2024-05-15 - tinynew.org. All Rights Reserved.
© 2024-05-15 - tinynew.org. 保留所有权利