首页

计算商品embedding然后平均得到用户embedding，会不会存在这种问题？第1页

1

huo-hua-de-41 网友的相关建议:

问题的本质在于维数诅咒curse of dimensionality，你需要的是一个对于高维向量的正确图景。你想象中的情况是左边2维或者3维的情况，这个时候猫猫狗狗的确是混在一起的，取平均后会有“四不像”的情况。但实际上，embedding都是几百维，是高维向量。每个样本猫或者狗都存在于一个个尖尖上，几个尖尖取平均后，只会依然离这几个尖尖最近，能够保证“四都像”。

chenran 网友的相关建议:

因为在高维空间中的平均，会依然离原来的点特别近，离其他的点特别远？

我们假设这样一个情形，在空间中取4个点{A1..A4}，取平均得A‘可以看作 User Embedding，再在空间中随机生成100个点{B1..B100}。我们计算A' 最近的点是在 {A1..A4} 中还是在 {B1..B100} 中。

在二维空间中特别明显，A‘ 大概率离B点集更近一些。我们跑个模拟，看看随着维度的变高，有什么变化。

可以看到，在低维度的时候，取平均会更像其他的 Item，但随着 Embedding 维度的增加，User Embedding 最近的点几乎全是A集中的点，依然在那几个 Item Embedding 的附近，而离其他的 Embedding 更远一些。

所以并不会是“四不像”，而是“四都像”。高维度和低维度上的直觉有时候很不同罢。

计算商品embedding然后平均得到用户embedding，会不会存在这种问题？的其他答案点击这里

1

相关话题

  自学深度学习是怎样一种体验？
  在哪里能找到各行业的分析研究报告？
  迁移学习与fine-tuning有什么区别？
  GAN:固定训练好的判别器网络，去指导训练生成器为什么不可以？
  Deep Learning 的专家如此急缺，它难在何处？
  用于数据挖掘的聚类算法有哪些，各有何优势？
  CVPR 2019 有哪些值得关注的亮点？
  怎样让机器有意识?
  如何评价 Kaiming 团队新作 Masked Autoencoders (MAE)？
  Transformer在工业界的应用瓶颈如何突破？

前一个讨论

机械工程专业为什么要学 C 语言？

下一个讨论

如何自学数学以达到数学博士的水平？

相关的话题

  梯度下降法的神经网络容易收敛到局部最优，为什么应用广泛？
  神经网络中 warmup 策略为什么有效；有什么理论解释么？
  在文本分类任务中，有哪些论文中很少提及却对性能有重要影响的tricks？
  如何评价 PyTorch 团队推出的推荐系统库 TorchRec？
  为何感觉“知识蒸馏”这几年没有什么成果？
  如何理解Inductive bias？
  人工智能相关的岗位薪酬状况如何？
  深度学习底层开发对数学有哪些要求？
  为什么我用相同的模型，数据，超参，随机种子，在两台服务器会得到不同的结果？
  普通FPGA工程师怎样向人工智能靠拢？
  如何看待Meta（恺明）最新论文ViTDet：只用ViT做backbone（不使用FPN）的检测模型？
  神经网络能否代替决策树算法？
  如何评价 PyTorch 团队推出的推荐系统库 TorchRec？
  医学生学习机器学习该如何入门？
  如何看待知乎的AI答主「四十二」？人工智能有可能理解生命的意义是什么吗？
  如何证明数据增强（Data Augmentation）有效性？
  经过足够长的时间， AlphaGo 的棋谱能收敛到一张上吗？
  据说机器学习长于预测，计量经济学长于解释。有什么具体例子是机器学习完成了很好的预测却在解释上表现不好？
  用于数据挖掘的聚类算法有哪些，各有何优势？
  卷积神经网络（CNN）的结构设计都有哪些思想？
  为什么机器学习解决网络安全问题总是失败?
  国内目前的量化交易是否很少涉及到机器学习？
  深度学习到底是「实验科学」还是「理论科学」？能否称为「算法」？
  能否使用神经网络来判断奇偶数？
  Resnet到底在解决一个什么问题呢？
  2021 年各家大厂的 AI Lab 现状如何？
  如何看待字节跳动 AI 实验室总监李磊入职 UCSB？
  如何系统学习机器学习？
  神经网络中如果一个重要特征C等于特征A+特征B（算数意义上的相加），选特征的时候还有必要选特征C吗?
  如果有一天人类被AI取代，他们将以什么样的方式生活，娱乐，工作？

© 2025-05-04 - tinynew.org. All Rights Reserved.
© 2025-05-04 - tinynew.org. 保留所有权利