首页

transformer中的Q,K,V到底是什么？第1页

1

zhaomingming0617 网友的相关建议:

Q:查询向量
K:表示被查询信息与其他信息的相关性的向量
V:表示被查询信息的向量

输入向量为：x， 1xm向量

       Q  = x * Wq K  = x * Wk V  = x * Wv  x对应信息V的注意力权重 与 Q*K.tranpose 成正比 等于说：x的注意力权重，由x自己来决定，所以叫自注意力。 Wq,Wk,Wv会根据任务目标更新变化，保证了自注意力机制的效果。  以下是点乘自注意力机制的公式

llllllllllll-6 网友的相关建议:

哈哈，突然想到了一个很形象的解释方法：

你有一个问题Q，然后去搜索引擎里面搜，搜索引擎里面有好多文章，每个文章V有一个能代表其正文内容的标题K，然后搜索引擎用你的问题Q和那些文章V的标题K进行一个匹配，看看相关度（QK --->attention值），然后你想用这些检索到的不同相关度的文章V来表示你的问题，就用这些相关度将检索的文章V做一个加权和，那么你就得到了一个新的Q'，这个Q'融合了相关性强的文章V更多信息，而融合了相关性弱的文章V较少的信息。这就是注意力机制，注意力度不同，重点关注（权值大）与你想要的东西相关性强的部分，稍微关注（权值小）相关性弱的部分。

transformer中的Q,K,V到底是什么？的其他答案点击这里

1

相关话题

  2021年，ncnn发展的如何了？
  如何评价Google最新提出的gMLP：MLP模型在CV和NLP任务上均取得较好的效果？
  CNN（卷积神经网络）、RNN（循环神经网络）、DNN（深度神经网络）的内部网络结构有什么区别？
  如何看待Capsule Network在NLP领域的潜力？
  深度学习到底是「实验科学」还是「理论科学」？能否称为「算法」？
  如何评价Sony新出的深度学习库NNabla？
  如何看待NLP领域最近比较火的prompt，能否借鉴到CV领域？
  如何评价Google 在TensorFlow 中引入的bfloat16 数据类型？
  为什么Transformer要用LayerNorm？
  transformer中的Q,K,V到底是什么？

前一个讨论

国家自然科学基金青年基金（2020）有那么难拿吗？

下一个讨论

想自学编程怎样下手？

相关的话题

  如何评价 MSRA 最新的 Deformable Convolutional Networks？
  如何评价基于游戏毁灭战士（Doom）的AI死亡竞赛大赛结果？
  深度学习做股票预测靠谱吗？
  如何评价mixup: BEYOND EMPIRICAL RISK MINIMIZATION？
  如何评价CUHK以及Yuanjun Xiong提出的Trajectory Convolution？
  如何解决测试中充斥着大量训练集中没见过的样本类型模型将其识别成非我族类仍然保持测试集的高精度？
  如何评价微软亚洲研究院提出的LightRNN？
  大牛Bengio 团队最新的研究和我自己之前的研究成果重复了，应该怎么办？
  国内做NLP业务的香侬科技值得去吗？
  TensorFlow 中 padding 的 SAME 和 VALID 两种方式有何异同？
  2019年NeurIPS有哪些糟糕的论文？
  请问刘知远老师提供的网易新闻标注数据集开源吗？
  百度学术能否替代 Google 学术网站？有没有其他选择？
  如何看待Transformer在CV上的应用前景，未来有可能替代CNN吗？
  2022 年人工智能领域的发展趋势是什么？你都有哪些期待？
  如何看待 TI7 上与 Dendi solo 的 OpenAI？
  国内 top2 高校研一在读，为什么感觉深度学习越学越懵?
  人工智能 CV 岗位是不是现在供严重大于需？
  ICLR 2018 有什么值得关注的亮点？
  如何评价微软提出的无监督视觉模型BEiT：ImageNet达到88.6，ADE20K达到57.0？
  如何评价各种关联因素分析算法,尤其是在算法效果对比方面?
  DL框架的未来发展，TensorFlow/MXNet/PyTorch, 选哪个？
  如何评价论文「Stochastic Training is Not Necessary ...」?
  2021年了，如何评价微软亚研提出的对偶学习（Dual Learning）？
  2021 年，深度学习方面取得了哪些关键性进展？
  如何评价 2015 版的 Magi 搜索引擎？
  在推荐系统中，如何较好的采用深度学习方法获取用户长短期兴趣？
  卷积神经网络中卷积核是如何学习到特征的？
  主题模型(topic model)到底还有没有用，该怎么用？
  如何看待华为 4 月 25 日发布的盘古智能大模型？在这个行业处于什么水平？

© 2025-06-21 - tinynew.org. All Rights Reserved.
© 2025-06-21 - tinynew.org. 保留所有权利