百科问答小站 logo
百科问答小站 font logo



如何评价剑桥,腾讯, DeepMind以及港大团队新作 SimCTG ? 第1页

  

user avatar   wang-yan-56-80 网友的相关建议: 
      

感谢关注我们的工作,这是我的前实习生苏熠暄与我以及实习生兰天合作的提出的一套新的文本生成训练+decoding框架,在做出初步结果以后,觉得效果不错,为了进一步完善方法,邀请了好朋友老孔以及老孔的好朋友老丹一起参与了这个工作。另外,在论文写好之前,这套方法已经被广泛用于我们内部产品中,取代了之前的top k top p sampling方法。

在这篇工作中,我们针对开放式文本生成任务(Open-ended Text Generation)提出了一个新的训练策略(SimCTG)+解码算法(contrastive search)。我们在来自多语言的不同任务以及实际工业场景中进行了大量的自动及人工评测集。实验结果(见下图)表明我们的方法显著提升了文本生成模型的效果。论文以及所有代码模型均已开源。在Github开源项目中我们详细展示了如何在中文,英文,日文语言生成模型上使用我们的方法。简而言之,这是一个让大家不再需要top k top k sampling的工作,欢迎感兴趣的朋友一起交流讨论。




  

相关话题

  AI领域的灌水之风如何破局? 
  为什么在R语言里多用<-而不是=表示赋值? 
  如何评价 Kaiming 团队新作 Masked Autoencoders (MAE)? 
  请问人工神经网络中的activation function的作用具体是什么?为什么ReLu要好过于tanh和sigmoid function? 
  搞机器学习的生环化材是天坑吗? 
  为什么学习深度学习感觉无法入门? 
  如何评价deepmind最新在nature上发表的论文《在人工网络中用网格样表征进行基于向量的导航》? 
  能否用具体的例子解释一下 (Model-based) Structural Estimation? 
  从今年校招来看,机器学习等算法岗位应届生超多,竞争激烈,未来 3-5 年机器学习相关就业会达到饱和吗? 
  如果有第谷的数据,现在的机器学习,深度学习有办法学出开普勒三定律吗? 

前一个讨论
图片上训的模型,怎么迁移视频上呢?
下一个讨论
如何看待 12 代英特尔酷睿 H45 新品,给游戏玩家或创作者带来怎样的新体验?





© 2024-11-05 - tinynew.org. All Rights Reserved.
© 2024-11-05 - tinynew.org. 保留所有权利