首页

请问下大家训练 SimCSE 时, loss 有没有这样的情况? 第1页

1

qiu-ming-shan-lao-si-ji-2-9 网友的相关建议:

谢邀

我才刚大二，不搞深度学习呀(｡•́︿•̀｡)

请问下大家训练 SimCSE 时, loss 有没有这样的情况? 的其他答案点击这里

1

相关话题

  如何理解attention中的Q,K,V？
  FPGA做深度学习能走多远？
  神经网络的万能逼近定理已经发展到什么地步了？
  如何评价基于游戏毁灭战士（Doom）的AI死亡竞赛大赛结果？
  ICML2020有哪些值得关注的工作?
  为什么 Bert 的三个 Embedding 可以进行相加？
  2022 年初，你认为哪项成果代表了现在人工智能的最高水平？
  如何进行图像模糊与清晰的分类？
  什么是迁移学习 (Transfer Learning)？这个领域历史发展前景如何？
  如果学习从零开始学习Pytorch,有优秀的开源项目可以推荐吗？

前一个讨论

被跳蚤咬的全身都是包是什么样的感受！？！？

下一个讨论

2024年的出生人口会是多少？

相关的话题

  如何评价1700亿参数的GPT-3？
  ICLR 2019 有什么值得关注的亮点？
  联邦学习在机器学习领域有什么独立存在的价值?
  怎样让机器有意识?
  如何评价深度学习相关顶级期刊论文难复现的问题？
  TensorFlow 中 padding 的 SAME 和 VALID 两种方式有何异同？
  生成式对抗网络GAN有哪些最新的发展，可以实际应用到哪些场景中？
  为什么 Bert 的三个 Embedding 可以进行相加？
  如何评价AlphaGo Zero？
  你遇见过什么当时很有潜力但是最终没有流行的深度学习算法?
  wasserstein 距离的问题?
  如何评价AlphaGo Zero？
  大牛Bengio 团队最新的研究和我自己之前的研究成果重复了，应该怎么办？
  国内哪些公司在用caffe、torch、TensorFlow、paddle等框架，哪些在用自研框架？
  NLP文本分类的本质是不是其实是找相似，对于要分类的句子，在训练集里找最相似的句子？
  如何评价陈天奇团队新开源的TVM？
  卷积神经网络如果将池化层去除，与神经网络的区别还大么？
  当前深度学习理论基础薄弱是否意味着我们应该放弃深度学习应用(计算机视觉、自然语言处理)？
  阿里的TDM树深度模型为什么很少有人用，是有哪些问题吗？
  深度学习到底是「实验科学」还是「理论科学」？能否称为「算法」？
  如何评价CVPR2019程序主席Derek Hoiem的论点：计算机视觉只是记忆，不是智能？
  AlphaGo「理解」围棋吗？
  如何评价 DeepMind 在星际中的失利，以及 OpenAI 在 Dota 上的成功？
  2021 年，深度学习方面取得了哪些关键性进展？
  2019年CVPR有哪些糟糕的论文?
  如何评价论文「Stochastic Training is Not Necessary ...」?
  如何看待Transformer在CV上的应用前景，未来有可能替代CNN吗？
  什么是人工智能？人工智能、机器学习、深度学习三者之间有什么关系吗？
  如何评价 Kaiming 团队新作 Masked Autoencoders (MAE)？
  adversarial training为什么会起作用？

© 2025-05-29 - tinynew.org. All Rights Reserved.
© 2025-05-29 - tinynew.org. 保留所有权利