首页

Word2vec 翻译到另一种语言，其向量空间之间的映射会不会是线性的？第1页

1

atom-native 网友的相关建议:

没有完全理解题主想要问什么，如果使用同样的mapping（脱离上下文），那源端语言的一个单词怎样得到目标端语言的不同单词。

你所说的语言之间的映射，取决于语言之间的相似程度，大部分时候都不是线性的。直观上来说，很多中文/英文词都没有对应的翻译，说明他们在各自的语义空间里的分布是不完全相似的（比如，presentation就很难找一个贴切的中文翻译）。但是用线性关系去近似不同语言之间的embedding是比较方便的，同时，虽然整个embedding space可能没有线性映射关系，但是不妨碍局部存在线性映射（e.g. anchor words）。

比如Adversarial Training for Unsupervised Bilingual Lexicon Induction 里的猫马猪（英西）

Unsupervised Alignment of Embeddings with Wasserstein Procrustes里面的水空气土地（英法）

Learning bilingual word embeddings with (almost) no bilingual data 里面的数字

数字好处在于语义明确，通用性强，缺点是样本少。用字典的好处在于样本多，缺点是可能会在通用性上有一定的妥协，同时对于很多语言可能没有办法构造足够多的平行语料对，Word Translation without Parallel Data里面的CSLS一定程度上缓解了对于语言相似性和平行语料的依赖。

当然了，语言自身也是会不断演化的，选用词向量的时候，也要考虑历史的进程（雾

如果你要用的是基于上下文的表示/内容的表示的话，某种程度上已经超出了word embedding的范畴了，不妨考虑一下BERT。

仅为抛砖引玉

Word2vec 翻译到另一种语言，其向量空间之间的映射会不会是线性的？的其他答案点击这里

1

相关话题

  用生成模型做数据增强data augmentation时，如何从合成数据中筛选出质量较好的样本？
  这个线性代数题应该怎么做？
  为什么矩阵内积的定义包含一个迹运算？
  如何用最简单的语言统一描述多元函数求导（对向量求导、对矩阵求导等）？
  是不是并不是所有问题都适合用神经网络预测？
  为什么交叉熵（cross-entropy）可以用于计算代价？
  GAN的生成器是怎么产生图片的？
  n阶矩阵A=（cos(αi−βj)）n，如何证det（A）=0？n,如何证明det(A)=0?
  深度学习调参有哪些技巧？
  注意力机制是如何学习到模型所应注意的区域的？

前一个讨论

如果李云龙成为五代火影，会怎样？

下一个讨论

如何理解分形的维度？

相关的话题

  学习机器学习有哪些好工具推荐？
  如何评价沐神他们写的《动手学深度学习》这本书？
  哪些线性代数（指一般意义上的本科一年级的课程）的难题可以用李群李代数的知识简便、优雅地做出来？
  有监督和无监督学习都各有哪些有名的算法和深度学习？
  如何证明若行列式 D 中有两行元素分别对应成比例，则 D=0？
  如何看待周志华等人的新书《机器学习理论导引》？
  迁移学习与fine-tuning有什么区别？
  深度学习中，模型大了好还是小了好呢？
  相比于时下流行的机器学习方法（联接主义），传统的人工智能方法（符号主义）有什么独一无二的优势？
  什么是meta-learning?
  如何评价 CVPR 2020的论文接收结果？有哪些亮点论文？
  基于深度学习的人工智能程序和传统程序的差别在哪里？
  PyTorch中在反向传播前为什么要手动将梯度清零？
  attention跟一维卷积的区别是啥？
  如何评价何恺明、Ross Girshick组的自监督时空表征学习新作？
  特征值和特征向量怎么求，最好有例题可以看看？？
  算法工程师的落地能力具体指的是什么？
  为什么Transformer适合做多模态任务？
  人工「神经网络」技术在信息处理上有何特点，工作原理是什么？
  现代人工神经网络是不是一个死胡同？这个技术是不是骗人的？
  如何理解 Swin Transformer 和 Vision Transformer不同任务上的差异？
  如何理解矩阵的「秩」？
  小样本学习中关于虚拟样本有效性的问题？
  Google 的神经网络生成图像 (Inceptionism) 是怎么做到的？
  为什么都说神经网络是个黑箱？
  机器全面代替人工劳动力的那一天，你能如何生存下去？
  如何评价国科大非数专业使用卓里奇和代数学引论？
  如何评价MXNet发布的1.0版本？
  这个用数分积分可以说明吗？不用高代上正定矩阵的?
  对神经网络某一层做了小改进，效果却提升显著，可以发论文吗？

© 2025-05-07 - tinynew.org. All Rights Reserved.
© 2025-05-07 - tinynew.org. 保留所有权利