首页

transformer中的Q,K,V到底是什么？第1页

1

zhaomingming0617 网友的相关建议:

Q:查询向量
K:表示被查询信息与其他信息的相关性的向量
V:表示被查询信息的向量

输入向量为：x， 1xm向量

       Q  = x * Wq K  = x * Wk V  = x * Wv  x对应信息V的注意力权重 与 Q*K.tranpose 成正比 等于说：x的注意力权重，由x自己来决定，所以叫自注意力。 Wq,Wk,Wv会根据任务目标更新变化，保证了自注意力机制的效果。  以下是点乘自注意力机制的公式

llllllllllll-6 网友的相关建议:

哈哈，突然想到了一个很形象的解释方法：

你有一个问题Q，然后去搜索引擎里面搜，搜索引擎里面有好多文章，每个文章V有一个能代表其正文内容的标题K，然后搜索引擎用你的问题Q和那些文章V的标题K进行一个匹配，看看相关度（QK --->attention值），然后你想用这些检索到的不同相关度的文章V来表示你的问题，就用这些相关度将检索的文章V做一个加权和，那么你就得到了一个新的Q'，这个Q'融合了相关性强的文章V更多信息，而融合了相关性弱的文章V较少的信息。这就是注意力机制，注意力度不同，重点关注（权值大）与你想要的东西相关性强的部分，稍微关注（权值小）相关性弱的部分。

transformer中的Q,K,V到底是什么？的其他答案点击这里

1

相关话题

  谈谈机器学习在网络安全领域的局限性，以及是否乐观？
  目标检测算法中Two-stage算法速度慢,到底在哪里?
  如何看待人工智能领域的很多专家认为「人工智能将对人类存亡造成威胁」的观点？
  如何评价谷歌用30亿数据训练的20亿参数ViT-G/14模型在 ImageNet 达到新的 SOTA？
  NIPS 2018 有什么值得关注的亮点？
  数字图像处理的工作是用传统算法更多还是用深度学习更多?
  有哪些优秀的深度学习入门书籍？需要先学习机器学习吗？
  AlphaGo「理解」围棋吗？
  深度学习和强化学习之间的差别有多大？
  如何看待人工智能领域的很多专家认为「人工智能将对人类存亡造成威胁」的观点？

前一个讨论

国家自然科学基金青年基金（2020）有那么难拿吗？

下一个讨论

想自学编程怎样下手？

相关的话题

  基于对比学习(Contrastive Learning)的文本表示模型【为什么】能学到语义【相似】度？
  如何将某个分布作为机器学习的特征？
  pytorch 的高层库ignite怎么样？
  transformer 为什么使用 layer normalization，而不是其他的归一化方法？
  为什么学习深度学习感觉无法入门？
  有没有可能运用人工神经网络将一种编程语言的代码翻译成任意的另一种编程语言，而不经过人工设计的编译过程？
  如何看待 Nervana 被 Intel 收购？
  有没有什么可以节省大量时间的 Deep Learning 效率神器？
  如何评价Google发布的第二代深度学习系统TensorFlow?
  如何看待Jeff Dean&Hinton投到ICLR17的MoE的工作？
  实体提取任务中使用BERT-CRF时，CRF根据数据统计可以得到转移概率，为啥还要训练呢？
  2021年，ncnn发展的如何了？
  如何评价微软亚洲研究院提出的LightRNN？
  PyTorch中在反向传播前为什么要手动将梯度清零？
  DL/ML 模型如何部署到生产环境中？
  国内哪些公司在用caffe、torch、TensorFlow、paddle等框架，哪些在用自研框架？
  2021 年了，TensorFlow 和 PyTorch 两个深度学习框架地位又有什么变化吗？
  机器学习里面的流形都是怎么用的？
  人工智能 CV 岗位是不是现在供严重大于需？
  Transformer在工业界的应用瓶颈如何突破？
  如何看待 ICLR2021 的拒稿被评为 ACL2021 的 Best Paper?
  如何评价FAIR提出的ConvNeXt：CNN匹敌Swin Transformer?
  为什么神经网络具有泛化能力？
  如何用自然语言处理判断一句话是否符合中文口语习惯？
  如何评价DALL-E模型的实现？
  结合深度学习的图像修复怎么实现？
  如果美国禁用 Tensorflow 和 Pytorch 对中国的人工智能有何影响？
  如果学习从零开始学习Pytorch,有优秀的开源项目可以推荐吗？
  算法岗位真的需要顶会才能入场吗？
  TensorFlow的自动求导具体是在哪部分代码里实现的？

© 2025-06-20 - tinynew.org. All Rights Reserved.
© 2025-06-20 - tinynew.org. 保留所有权利