首页

计算商品embedding然后平均得到用户embedding，会不会存在这种问题？第1页

1

huo-hua-de-41 网友的相关建议:

问题的本质在于维数诅咒curse of dimensionality，你需要的是一个对于高维向量的正确图景。你想象中的情况是左边2维或者3维的情况，这个时候猫猫狗狗的确是混在一起的，取平均后会有“四不像”的情况。但实际上，embedding都是几百维，是高维向量。每个样本猫或者狗都存在于一个个尖尖上，几个尖尖取平均后，只会依然离这几个尖尖最近，能够保证“四都像”。

chenran 网友的相关建议:

因为在高维空间中的平均，会依然离原来的点特别近，离其他的点特别远？

我们假设这样一个情形，在空间中取4个点{A1..A4}，取平均得A‘可以看作 User Embedding，再在空间中随机生成100个点{B1..B100}。我们计算A' 最近的点是在 {A1..A4} 中还是在 {B1..B100} 中。

在二维空间中特别明显，A‘ 大概率离B点集更近一些。我们跑个模拟，看看随着维度的变高，有什么变化。

可以看到，在低维度的时候，取平均会更像其他的 Item，但随着 Embedding 维度的增加，User Embedding 最近的点几乎全是A集中的点，依然在那几个 Item Embedding 的附近，而离其他的 Embedding 更远一些。

所以并不会是“四不像”，而是“四都像”。高维度和低维度上的直觉有时候很不同罢。

计算商品embedding然后平均得到用户embedding，会不会存在这种问题？的其他答案点击这里

1

相关话题

  因果推断会是下一个AI热潮吗？
  GAN 真的创造了新的信息吗？
  TVM 最新发布版本 0.3 有哪些亮点？
  领域自适应需要用到测试集数据，这样的方法有啥意义呢？
  如何看待多模态transformer，是否会成为多模态领域的主流？
  分类机器学习中，某一标签占比太大（标签稀疏），如何学习？
  魔鬼如何在最短时间内抓住天使？
  新智元提问：如何看待李飞飞高徒Karpathy加入特斯拉，主管人工智能部门？
  如何激怒一位人工智能（机器学习、深度学习、强化学习等）爱好者？
  能分享你收藏的国外AI talk, seminar平台或网站吗？

前一个讨论

机械工程专业为什么要学 C 语言？

下一个讨论

如何自学数学以达到数学博士的水平？

相关的话题

  Python 如何画出漂亮的地图？
  深度学习底层开发对数学有哪些要求？
  把某人的 DNA 序列作为输入，正面照片作为输出，丢到深度神经网络里面学习，可行吗？
  如何评价清华大学发布的自研深度学习框架-计图(Jittor)？
  实验室只有1080的显卡，老师还想让发深度学习论文，也不给配置好的显卡怎么办？
  年轻人为什么要做期货？
  2021 年，深度学习方面取得了哪些关键性进展？
  ICLR 2019 有什么值得关注的亮点？
  是不是并不是所有问题都适合用神经网络预测？
  神经网络训练多个epoch，写论文的时候可以取最好的效果那一个epoch作为结果吗？
  如何理解今年发表在JMLR上随机森林算法SPORF？
  强化学习和自适应控制的关系是什么？
  如何理解链接预测（link prediction）？
  有哪些LSTM(Long Short Term Memory)和RNN(Recurrent)网络的教程？
  计算机视觉和自然语言处理，哪个更具有发展前景呢，还是各有千秋呢？
  如何评价 MXNet 被 Amazon AWS 选为官方深度学习平台？
  如何看待鄂维南院士等发起的机器学习联合研讨计划（c2sml.cn）？
  自学深度学习是怎样一种体验？
  卷积神经网络中卷积核是如何学习到特征的？
  你遇见过什么当时很有潜力但是最终没有流行的深度学习算法?
  人工智能在发展到极高的程度之后能否算得上是一种生命？
  如何评价Kaiming He团队的MoCo v3？
  从应用的角度来看，深度学习怎样快速入门？
  新手如何入门pytorch？
  如何看待西安电子科技大学偷偷给贫困生打钱，大数据精准帮助贫困生是否值得推广？
  Resnet到底在解决一个什么问题呢？
  国内做NLP业务的香侬科技值得去吗？
  如何评价 Face++ 旷视科技最新出品的检测专用 backbone 网络 DetNet ？
  当前人工智能特别是深度学习最前沿的研究方向是什么？
  人工智能在发展到极高的程度之后能否算得上是一种生命？

© 2025-02-12 - tinynew.org. All Rights Reserved.
© 2025-02-12 - tinynew.org. 保留所有权利