首页

如何评价剑桥，腾讯， DeepMind以及港大团队新作 SimCTG ? 第1页

1

wang-yan-56-80 网友的相关建议:

感谢关注我们的工作，这是我的前实习生苏熠暄与我以及实习生兰天合作的提出的一套新的文本生成训练+decoding框架，在做出初步结果以后，觉得效果不错，为了进一步完善方法，邀请了好朋友老孔以及老孔的好朋友老丹一起参与了这个工作。另外，在论文写好之前，这套方法已经被广泛用于我们内部产品中，取代了之前的top k top p sampling方法。

在这篇工作中，我们针对开放式文本生成任务(Open-ended Text Generation)提出了一个新的训练策略(SimCTG)+解码算法(contrastive search)。我们在来自多语言的不同任务以及实际工业场景中进行了大量的自动及人工评测集。实验结果(见下图)表明我们的方法显著提升了文本生成模型的效果。论文以及所有代码模型均已开源。在Github开源项目中我们详细展示了如何在中文，英文，日文语言生成模型上使用我们的方法。简而言之，这是一个让大家不再需要top k top k sampling的工作，欢迎感兴趣的朋友一起交流讨论。

如何评价剑桥，腾讯， DeepMind以及港大团队新作 SimCTG ? 的其他答案点击这里

1

相关话题

  如何评价清华大学发布的自研深度学习框架-计图(Jittor)？
  现在的人工智能是否走上了数学的极端？
  ICLR 2022有哪些值得关注的投稿？
  神经网络的损失函数为什么是非凸的?
  如何看待Yoav Goldberg 怒怼来自MILA的GAN for NLG的paper?
  计算统计学（Computational Statistics）有什么好的资源和教材以及学习方法推荐？
  二分类问题，应该选择sigmoid还是softmax？
  国内 top2 高校研一在读，为什么感觉深度学习越学越懵?
  究竟什么是损失函数 loss function?
  为什么在SGD中使用L1正则化很难获得稀疏性？

前一个讨论

图片上训的模型，怎么迁移视频上呢？

下一个讨论

如何看待 12 代英特尔酷睿 H45 新品，给游戏玩家或创作者带来怎样的新体验？

相关的话题

  分类问题的label为啥必须是 one hot 形式？
  机器学习里面的流形都是怎么用的？
  如何判断两个Deep Learning 数据集的数据分布是否一致？
  如何看待亚马逊的无人超市产品 Amazon Go?
  没有顶会的CV/NLP方向的博士生毕业出路在哪里？
  基于深度学习的自然语言处理在 2016 年有哪些值得期待的发展？
  如何看待Meta（恺明）最新论文ViTDet：只用ViT做backbone（不使用FPN）的检测模型？
  请问人工神经网络中的activation function的作用具体是什么？为什么ReLu要好过于tanh和sigmoid function?
  如何评价AlphaGo Zero？
  目前，人工智能语音在说中文时的语气感觉上还比较机械，怎样使人工智能语音的语气更自然一些？
  在CV/NLP/DL领域中，有哪些修改一行代码或者几行代码提升性能的算法？
  在哪里能找到各行业的分析研究报告？
  image caption这个方向更偏向NLP还是CV？
  可以对只有一个像素的图片拥有版权或著作权吗？为什么？
  Evidential deep learning里一般怎么估计多标签分类的Uncertainty？
  计算机视觉中video understanding领域有什么研究方向和比较重要的成果？
  batchsize=1时可以用BN吗?
  深度学习调参有哪些技巧？
  如何看待Meta（恺明）最新论文ViTDet：只用ViT做backbone（不使用FPN）的检测模型？
  如何评价 2018 年度图灵奖颁发给三位深度学习之父？
  如何全面理解工程师红利？
  如何评价 2021 年 12 月新改版的知识引擎 magi.com？
  如何用简单易懂的例子解释隐马尔可夫模型？
  如何看待MXNet获得amazon官方支持首位？
  目前手势识别发展到什么水平了？
  mxnet的并行计算为什么这么牛，是什么原理？
  Bert中的词向量各向异性具体什么意思啊？
  目前有哪些比较成功的人工智能应用？
  如何看待多模态transformer，是否会成为多模态领域的主流？
  如果学习从零开始学习Pytorch,有优秀的开源项目可以推荐吗？

© 2025-06-26 - tinynew.org. All Rights Reserved.
© 2025-06-26 - tinynew.org. 保留所有权利