百科问答小站 logo
百科问答小站 font logo



为什么CV能做到让一幅人脸图动了笑了,而NLP的text-style-transfer进展貌似一般? 第1页

  

user avatar   shaohuali 网友的相关建议: 
      

因为脸的复杂度很低。虽然人们可以感到脸的各种微妙差异,但其实是因为人脑里有专门的脸部识别区 [1-2],放大了实际图像里的variations。实际上人脸图像是可以用一个低维manifold表示的,所以StyleGAN之类模型可以把人脸表示得很好。而nlp是高度非线性,语义很diverse,每个段落都很specific,所以语料里可以直接transfer的语义比较稀疏,导致style transfer很难做。

[1] m.guokr.com/article/441

[2]


user avatar   xie-ling-xi 网友的相关建议: 
      

女王:求求题主放过我,我可不敢有什么政绩。。。




  

相关话题

  计算机视觉顶级会议论文中比较适合初学计算机视觉的人做的复现实验有哪些? 
  什么是人工智能?人工智能、机器学习、深度学习三者之间有什么关系吗? 
  数据挖掘与数据分析的主要区别是什么? 
  如何评价mixup: BEYOND EMPIRICAL RISK MINIMIZATION? 
  有没有值得推荐的随机森林 Random Forest教材? 
  当前深度学习理论基础薄弱是否意味着我们应该放弃深度学习应用(计算机视觉、自然语言处理)? 
  对于神经网络,硕士博士不需要弄明白原理,只需要应用,是这样吗? 
  pytorch ddp训练中一个node fail,导致整个训练失败,有可能解决吗? 
  有什么深度学习数学基础书推荐? 
  计算商品embedding然后平均得到用户embedding,会不会存在这种问题? 

前一个讨论
理论研究、基础研究、应用研究的区别在哪?理论和应用能明白,基础到底是什么概念?
下一个讨论
男朋友跟我说不想出彩礼怎么办?





© 2024-05-21 - tinynew.org. All Rights Reserved.
© 2024-05-21 - tinynew.org. 保留所有权利