首页
查找话题
首页
为什么 BERT 的 intermediate_size 这么大?
为什么 BERT 的 intermediate_size 这么大? 第1页
1
guotong1988 网友的相关建议:
建议阅读:《Optimal Subarchitecture Extraction for BERT》
为什么 BERT 的 intermediate_size 这么大? 的其他答案 点击这里
1
相关话题
请问应该怎样去学习图像识别和深度学习?
KL散度衡量的是两个概率分布的距离吗?
面试官如何判断面试者的机器学习水平?
对神经网络某一层做了小改进,效果却提升显著,可以发论文吗?
BERT中,multi-head 768*64*12与直接使用768*768矩阵统一计算,有什么区别?
编程达到什么水平才能编写出像caffe这样的深度学习框架?
如何评价陈天奇团队新开源的TVM?
如何评价FAIR提出的ConvNeXt:CNN匹敌Swin Transformer?
为什么Transformer适合做多模态任务?
为什么说深度学习没有理论基础?
前一个讨论
目标检测该怎么学呀,目前研一,老师啥也不会,感觉毕不了业了?
下一个讨论
多模态训练,怎么解决不同模态之间差异的问题?
相关的话题
用生成模型做数据增强data augmentation时,如何从合成数据中筛选出质量较好的样本?
《人工智能训练师国家职业技能标准》发布,有哪些值得关注的信息?
如何理解 Graph Convolutional Network(GCN)?
用生成模型做数据增强data augmentation时,如何从合成数据中筛选出质量较好的样本?
从应用的角度来看,深度学习怎样快速入门?
在Auto ML的冲击下,ML算法人员是否会在前者成熟后失业的情况?
人工智能的意义和价值是什么?
计算机视觉中,目前有哪些经典的目标跟踪算法?
自动化的控制与检测领域中,有没有像机器学习、图像处理领域一样经典巧妙的算法?
能分享你收藏的国外AI talk, seminar平台或网站吗?
scikit-learn, tensorflow, pytorch真的只需要查下API,不需要学吗?
如果百年后深度学习最终有了公认的数学理论作为基础,能解释实验中的各类玄学,那这个理论会长什么样子?
你见过哪些“人工智障”?
如何看待2016年3月柯洁表示 AlphaGo「赢不了我」?
研究推荐系统要对NLP很了解吗?
硕士方向,选择迁移学习还是自然语言处理?
图像处理和机器学习有什么关系?
如果百年后深度学习最终有了公认的数学理论作为基础,能解释实验中的各类玄学,那这个理论会长什么样子?
你遇见过什么当时很有潜力但是最终没有流行的深度学习算法?
联邦学习在机器学习领域有什么独立存在的价值?
Yann LeCun、Geoffrey Hinton或Yoshua Bengio能得图灵奖吗?
计算机视觉和自然语言处理,哪个更具有发展前景呢,还是各有千秋呢?
马上计算机研一,想问一下机器学习、深度学习…大家都是怎么入门的?
你所在的研究领域里,有哪些工作的结果虽然不是造假,但是是精挑细选出来的?
请问一下,机器学习领域的联邦学习技术,目前看到最多的是微众银行,国内还有哪些顶级专家及机构和大学?
到了 2022 年,人工智能有哪些真正可落地的应用?
各种机器学习算法的应用场景分别是什么(比如朴素贝叶斯、决策树、K 近邻、SVM、逻辑回归最大熵模型)?
看完麻省理工博士胡渊鸣用代码实现「冰雪奇缘」后,自己陷入了深深的自卑,如何排解这种情绪?
GAN生成的数据没有标签怎么用来训练分类模型?
有监督和无监督学习都各有哪些有名的算法和深度学习?
服务条款
联系我们
关于我们
隐私政策
© 2025-04-20 - tinynew.org. All Rights Reserved.
© 2025-04-20 - tinynew.org. 保留所有权利