为什么CV能做到让一幅人脸图动了笑了，而NLP的text-style-transfer进展貌似一般？第1页

shaohuali 网友的相关建议:

因为脸的复杂度很低。虽然人们可以感到脸的各种微妙差异，但其实是因为人脑里有专门的脸部识别区 [1-2]，放大了实际图像里的variations。实际上人脸图像是可以用一个低维manifold表示的，所以StyleGAN之类模型可以把人脸表示得很好。而nlp是高度非线性，语义很diverse，每个段落都很specific，所以语料里可以直接transfer的语义比较稀疏，导致style transfer很难做。

[1] https://m.guokr.com/article/441966/

[2]

xie-ling-xi 网友的相关建议:

女王:求求题主放过我，我可不敢有什么政绩。。。

为什么CV能做到让一幅人脸图动了笑了，而NLP的text-style-transfer进展貌似一般？的其他答案点击这里

相关话题

  如何看待QQ邮箱翻译出他人的快递通知？
  如何评价 CVPR2022 的审稿结果和录取情况？
  为何总感觉人工智能和神经科学（神经网络）被绑在一起？
  如何评价微软亚洲研究院提出的LightRNN？
  如何看待人工智能领域的很多专家认为「人工智能将对人类存亡造成威胁」的观点？
  Word2vec 翻译到另一种语言，其向量空间之间的映射会不会是线性的？
  神经网络中 warmup 策略为什么有效；有什么理论解释么？
  如何理解 Graph Convolutional Network（GCN）？
  如何评价微软新出的自拍软件 Microsoft Selfie？
  机器学习算法进行分类时，样本极度不平衡，评估模型要看哪些指标？

为什么CV能做到让一幅人脸图动了笑了，而NLP的text-style-transfer进展貌似一般？ 第1页

相关话题

前一个讨论

下一个讨论

相关的话题

为什么CV能做到让一幅人脸图动了笑了，而NLP的text-style-transfer进展貌似一般？第1页