首页
查找话题
首页
请问下大家训练 SimCSE 时, loss 有没有这样的情况?
请问下大家训练 SimCSE 时, loss 有没有这样的情况? 第1页
1
qiu-ming-shan-lao-si-ji-2-9 网友的相关建议:
谢邀
我才刚大二,不搞深度学习呀(。•́︿•̀。)
请问下大家训练 SimCSE 时, loss 有没有这样的情况? 的其他答案 点击这里
1
相关话题
使用pytorch时,训练集数据太多达到上千万张,Dataloader加载很慢怎么办?
如何看待鄂维南院士等发起的机器学习联合研讨计划(c2sml.cn)?
全连接层的作用是什么?
为什么 MobileNet、ShuffleNet 在理论上速度很快,工程上并没有特别大的提升?
如何评价浪潮发布的2457亿参数源1.0智能大模型?与GPT-3相比如何?处于AI模型领域什么水平?
没有顶会的CV/NLP方向的博士生毕业出路在哪里?
如何评价Deepmind自监督新作BYOL?
请问刘知远老师提供的网易新闻标注数据集开源吗?
如何看待End-to-End Object Detection with Transformers?
如何评价CVPR2019程序主席Derek Hoiem的论点:计算机视觉只是记忆,不是智能?
前一个讨论
被跳蚤咬的全身都是包是什么样的感受!?!?
下一个讨论
2024年的出生人口会是多少?
相关的话题
对于多指标评价,BP神经网络评价和TOPSIS有什么区别呢?
深度学习应用在哪些领域让你觉得「我去,这也能行!」?
2021 年了,机器/深度学习还有哪些坑比较好挖?
Yann LeCun、Geoffrey Hinton或Yoshua Bengio能得图灵奖吗?
百度学术能否替代 Google 学术网站?有没有其他选择?
NLP 中 prompt learning 有哪些可能的天生缺陷?目前有什么样的方法来解决这样的缺陷?
AlphaGo「理解」围棋吗?
目前有哪些比较成功的人工智能应用?
Transformer在工业界的应用瓶颈如何突破?
如何评价深度学习之父Hinton发布的Capsule论文?
除了深度神经网络已经实现的特性以外,大脑还有哪些特性是值得机器学习领域借鉴的?
为什么现在的CNN模型都是在GoogleNet、VGGNet或者AlexNet上调整的?
如何理解深度学习源码里经常出现的logits?
NLP文本分类的本质是不是其实是找相似,对于要分类的句子,在训练集里找最相似的句子?
神经网络的万能逼近定理已经发展到什么地步了?
如何评价浪潮发布的2457亿参数源1.0智能大模型?与GPT-3相比如何?处于AI模型领域什么水平?
如何看待 Nervana 被 Intel 收购?
transformer中的Q,K,V到底是什么?
CPU和GPU跑深度学习差别有多大?
transformer 为什么使用 layer normalization,而不是其他的归一化方法?
如何评价Google提出的MLP-Mixer:只需要MLP就可以在ImageNet上达到SOTA?
如何看待Tensor Comprehensions?与TVM有何异同?
贝叶斯深度学习是什么,和传统神经网络有何不同?
为什么softmax很少会出现[0.5,0.5]?
在五到十年内,人工智能能复原成人影片中的被马赛克部分吗?
如何看待 AlphaFold 在蛋白质结构预测领域的成功?
如何评价深度学习之父Hinton发布的Capsule论文?
Bert中的词向量各向异性具体什么意思啊?
如何看待NLP领域最近比较火的prompt,能否借鉴到CV领域?
如何看待谷歌研究人员提出的卷积正则化方法「DropBlock」?
服务条款
联系我们
关于我们
隐私政策
© 2025-04-14 - tinynew.org. All Rights Reserved.
© 2025-04-14 - tinynew.org. 保留所有权利