首页

如何评价谷歌提出的 Pix2Seq：将目标检测看成语言建模，效果超过 DETR？第1页

1

xiaohuzc 网友的相关建议:

Transformer is only you need！

简单看了一下，挺吃惊的，没有想到目标检测还可以这样搞，而且效果看起来还行，把目标检测看成语言建模，也不需要啥花里胡哨的loss了。

一些开创性的工作都是谷歌做的，如Transformer，Bert，ViT。

如何评价谷歌提出的 Pix2Seq：将目标检测看成语言建模，效果超过 DETR？的其他答案点击这里

1

相关话题

  梯度下降法的神经网络容易收敛到局部最优，为什么应用广泛？
  如何看待微博上疑似出现来自境外的AI“拳师”？
  如何看待全球第一位「数字航天员小诤」?数字技术跨界应用是否正在加快？
  硕士方向，选择迁移学习还是自然语言处理？
  从鸦片战争到如今，我们中国是怎样一步步获得现在的国际地位的？
  LeCun 为什么要卸任 FAIR（Facebook AI 实验室）负责人，工程和研究的矛盾可调和吗？
  mxnet的并行计算为什么这么牛，是什么原理？
  现在的人工智能水平，能代替程序员写代码吗？如果有一天能写代码，是否会促使它发展自己的思维？
  机器学习能否用于综合评价？具体怎么操作？
  全连接层的作用是什么？

前一个讨论

主动学习(Active learning)算法的原理是什么，有哪些比较具体的应用？

下一个讨论

硕士方向，选择迁移学习还是自然语言处理？

相关的话题

  人工智能会有宗教信仰吗？
  假如我穿越到2017年第一个提出了Transformer、BERT等模型，我可以保送到清华北大吗？
  如何开发一个自己的 TensorFlow？
  如何评价CVPR2019程序主席Derek Hoiem的论点：计算机视觉只是记忆，不是智能？
  深度学习attention机制中的Q,K,V分别是从哪来的？
  20年后，你所在行业的科技会发展到什么程度？
  人工智能可以解决人类难题吗？
  如何看待阿里巴巴提出的 FashionAI 比赛？
  为什么熵值最大的分布状态是正态分布而不是均匀分布？
  为什么不训练黑猩猩来代替人民从事体力和简单重复操作呢？
  如何解读 Jeff Dean 等联合在 arXiv 上发布的用深度学习分析电子病历的论文？
  假如我穿越到2017年第一个提出了Transformer、BERT等模型，我可以保送到清华北大吗？
  如何评价第二局比赛 AlphaGo 又一次战胜李世石？
  人工智能是不是走错了方向？
  人工智能的完全诞生是否意味着第四次信息革命？
  请问机器学习中的预测与决策的区别是什么，他们的界限在哪里呢？
  深度学习如何入门？
  为什么CV能做到让一幅人脸图动了笑了，而NLP的text-style-transfer进展貌似一般？
  机器人的视觉伺服控制能在20年内应用于工业界吗？
  从今年校招来看，机器学习等算法岗位应届生超多，竞争激烈，未来 3-5 年机器学习相关就业会达到饱和吗？
  本科，选港大还是上交？
  如何看待2021年中国工程院新增院士中人工智能领域候选人全部落选？
  AlphaGo 能战胜李世石吗？
  我们难道必须发展人工智能吗？
  云米在米粉节发布一系列黑科技新品，值得米粉们期待吗？
  联邦学习是否有必要学习密码学知识?
  如何评价《人民日报》于 10 月 5 日发表的《不能让算法决定内容》？
  如何评价马毅教授的 NeurIPS 2020 中稿文章 MCR2 及自称弄明白深度学习了？
  如何看待人工智能攻破德州扑克？
  如何评价旷视开源的YOLOX，效果超过YOLOv5?

© 2025-06-12 - tinynew.org. All Rights Reserved.
© 2025-06-12 - tinynew.org. 保留所有权利