首页
查找话题
首页
请问下大家训练 SimCSE 时, loss 有没有这样的情况?
请问下大家训练 SimCSE 时, loss 有没有这样的情况? 第1页
1
qiu-ming-shan-lao-si-ji-2-9 网友的相关建议:
谢邀
我才刚大二,不搞深度学习呀(。•́︿•̀。)
请问下大家训练 SimCSE 时, loss 有没有这样的情况? 的其他答案 点击这里
1
相关话题
在实际工程系统中,MPC太复杂,难以做到realtime。因此都利用数据,MPC对比RL还有优势么?
GAN:固定训练好的判别器网络,去指导训练生成器为什么不可以?
物理专业的学生如何看待机器学习和大数据这些方向呢?
如何评价 BERT 模型?
为什么要压缩模型,而不是直接训练一个小的CNN?
为什么现在有这么多人工智能无用论?
在机器学习模型的训练期间,大概几十分钟到几小时不等,大家都会在等实验的时候做什么?
有没有什么可以节省大量时间的 Deep Learning 效率神器?
如何评价微软机器翻译在 WMT2017 中英翻译达到「人类水平」?
如何看待KDD'21的文章,异质图神经网络的效果不如简单的GCN、GAT?
前一个讨论
被跳蚤咬的全身都是包是什么样的感受!?!?
下一个讨论
2024年的出生人口会是多少?
相关的话题
如何理解MCMC中的细致平稳条件?
transformer 为什么使用 layer normalization,而不是其他的归一化方法?
TVM 最新发布版本 0.3 有哪些亮点?
如何评价AlphaGo Zero?
如何看待Yoav Goldberg 怒怼来自MILA的GAN for NLG的paper?
深度学习做股票预测靠谱吗?
为什么Bert中的CLS在未fine tune时作为sentence embedding性能非常糟糕?
神经网络的损失函数为什么是非凸的?
生成对抗网络的毕设怎么上手?
围棋AI为什么没有下出同局?
2021年深度学习哪些方向比较新颖,处于上升期或者朝阳阶段,没那么饱和,比较有研究潜力?
如何看待多模态transformer,是否会成为多模态领域的主流?
马上计算机研一,想问一下机器学习、深度学习…大家都是怎么入门的?
神经网络中的能量函数是如何定义的?
如何理解今年发表在JMLR上随机森林算法SPORF?
Yann LeCun、Geoffrey Hinton或Yoshua Bengio能得图灵奖吗?
深度学习的多个loss如何平衡?
如何评价CUHK以及Yuanjun Xiong提出的Trajectory Convolution?
2020年,多标签学习(multi-label)有了哪些新的进展?
如何评价小米开源的移动端深度学习框架MACE?
物理专业的学生如何看待机器学习和大数据这些方向呢?
Transformer是如何处理可变长度数据的?
新手如何入门pytorch?
如何评价浪潮发布的2457亿参数源1.0智能大模型?与GPT-3相比如何?处于AI模型领域什么水平?
为什么在SGD中使用L1正则化很难获得稀疏性?
BERT中,multi-head 768*64*12与直接使用768*768矩阵统一计算,有什么区别?
用生成模型做数据增强data augmentation时,如何从合成数据中筛选出质量较好的样本?
如何评价移动端吊打一切万众期待的商汤深度学习推理框架PPL开源了却没有支持移动端?
ICLR 2019 有什么值得关注的亮点?
你见过最差的算法工程师能差到什么程度?
服务条款
联系我们
关于我们
隐私政策
© 2025-01-13 - tinynew.org. All Rights Reserved.
© 2025-01-13 - tinynew.org. 保留所有权利