首页

请问下大家训练 SimCSE 时, loss 有没有这样的情况? 第1页

1

qiu-ming-shan-lao-si-ji-2-9 网友的相关建议:

谢邀

我才刚大二，不搞深度学习呀(｡•́︿•̀｡)

请问下大家训练 SimCSE 时, loss 有没有这样的情况? 的其他答案点击这里

1

相关话题

  目前 AI 在疾病的诊断和治疗上，有哪些成功的应用？
  如何评价陈天奇的模块化深度学习系统NNVM？
  搞机器学习的生环化材是天坑吗？
  除了深度神经网络已经实现的特性以外，大脑还有哪些特性是值得机器学习领域借鉴的？
  当前深度学习理论基础薄弱是否意味着我们应该放弃深度学习应用(计算机视觉、自然语言处理)？
  如何看待FAIR提出的8-bit optimizer：效果和32-bit optimizer相当？
  无人车为什么一定要用激光雷达做，双目视觉难道不行吗？
  迁移学习入门，新手该如何下手？
  深度学习在无人驾驶汽车上面的运用有哪些？
  BERT模型可以使用无监督的方法做文本相似度任务吗？

前一个讨论

被跳蚤咬的全身都是包是什么样的感受！？！？

下一个讨论

2024年的出生人口会是多少？

相关的话题

  CVPR2022 有什么值得关注的论文 ?
  为什么机器学习解决网络安全问题总是失败?
  怎么选取训练神经网络时的Batch size?
  如何看待NVIDIA 即将开源的DLA？
  Bert中的词向量各向异性具体什么意思啊？
  联邦学习在机器学习领域有什么独立存在的价值?
  如何评价 7 月 31 日一流科技开源的深度学习框架 OneFlow？
  如何评价Facebook AI提出的ResMLP，对比Google的MLP-Mixer?
  如何评价余凯在朋友圈发表呼吁大家用 caffe、mxnet 等框架，避免使用 TensorFlow？
  GAN的生成器是怎么产生图片的？
  深度学习图像处理什么时候用到GPU？
  为什么要压缩模型，而不是直接训练一个小的CNN？
  为什么最近几年 FPGA 变得越发受大家重视了？
  从应用的角度来看，深度学习怎样快速入门？
  有哪些深度学习效果不如传统方法的经典案例？
  如何评价MSRA视觉组最新对spatial attention mechanism分析论文？
  深度学习做股票预测靠谱吗？
  多模态方面，有哪些牛组值得我们follow他们的工作？
  如何评价 Exploring Simple Siamese Learning?
  为什么Bert中的CLS在未fine tune时作为sentence embedding性能非常糟糕？
  为什么ViT里的image patch要设计成不重叠？
  pytorch dataloader数据加载占用了大部分时间，各位大佬都是怎么解决的？
  为什么小模型已经可以很好地拟合数据集了，换大模型效果却要比小模型好？
  如果推出一款有「滤镜」功能的写作软件，修饰平庸的文字，会有市场吗？
  如何评价微软机器翻译在 WMT2017 中英翻译达到「人类水平」？
  为什么 MobileNet、ShuffleNet 在理论上速度很快，工程上并没有特别大的提升？
  如何评价剑桥，腾讯， DeepMind以及港大团队新作 SimCTG ?
  2021 年了，TensorFlow 和 PyTorch 两个深度学习框架地位又有什么变化吗？
  中国和美国谁能成人工智能领域的领军者？
  计算机视觉研一，只学过Python基础，目前代码能力很差，要不要换导师，不换的话如何毕业？

© 2025-05-06 - tinynew.org. All Rights Reserved.
© 2025-05-06 - tinynew.org. 保留所有权利