首页
查找话题
首页
请问人工神经网络中的activation function的作用具体是什么?为什么ReLu要好过于tanh和sigmoid function?
请问人工神经网络中的activation function的作用具体是什么?为什么ReLu要好过于tanh和sigmoid function? 第1页
1
jia-wei-97-19 网友的相关建议:
最近自学神经网络,一直不太明白activation的具体作用到底是干嘛的,不用activation又会有什么影响
wang-feng-98-82 网友的相关建议:
最近自学神经网络,一直不太明白activation的具体作用到底是干嘛的,不用activation又会有什么影响
请问人工神经网络中的activation function的作用具体是什么?为什么ReLu要好过于tanh和sigmoid function? 的其他答案 点击这里
1
相关话题
为什么中国有超级计算机,但是中国的 CPU 不行?
for 循环的 "for" 是什么意思?为什么用这个词?
非高中oi选手在清华计算机系就读是什么体验?
按照这个推荐的顺序学下来计算机水平能达到什么程度?
迁移学习入门,新手该如何下手?
计算机专业如果想去从事学术,应具备哪些基础知识?
以下我关于虚拟地址与物理地址的理解是正确的吗?
计算流体力学(CFD)里应用注意力机制(attention)是否可行?
Transformer在工业界的应用瓶颈如何突破?
姚安娜毕业于哈佛大学计算机科学和统计学专业,为什么还要进娱乐圈?高学历人才进娱乐圈是趋势吗?
前一个讨论
国内研究生不小心跟了一个水货老师是什么样的体验?
下一个讨论
基于深度学习的自然语言处理在 2016 年有哪些值得期待的发展?
相关的话题
什么时候对数据进行[0,1]归一化,什么时候[-1,1]归一化,二者分别在什么场景?
如何评价何恺明等 arxiv 新作 Rethinking ImageNet Pre-training?
神经网络中的能量函数是如何定义的?
你写过什么有趣的程序?
为什么编程语言语法的设计不往缩小与自然语言的差别的方向发展,或者说在这个方向发展得这么慢呢?
如何简单形象又有趣地讲解神经网络是什么?
如何评价Kaiming He团队的MoCo v3?
国内哪些公司在用caffe、torch、TensorFlow、paddle等框架,哪些在用自研框架?
你认为最优美的数据结构是什么?
resnet(残差网络)的F(x)究竟长什么样子?
为什么很多人觉得计算机专业的会修电脑?
为什么中国有超级计算机,但是中国的 CPU 不行?
为什么 BERT 的 intermediate_size 这么大?
如何评价 GitHub 与 OpenAI 合作推出的 AI 代码建议方案 Copilot?
PyTorch中在反向传播前为什么要手动将梯度清零?
如何直观地解释 backpropagation 算法?
程序员和计算机科学家有什么不同?
Google 的神经网络生成图像 (Inceptionism) 是怎么做到的?
当前深度学习理论基础薄弱是否意味着我们应该放弃深度学习应用(计算机视觉、自然语言处理)?
梯度下降法的神经网络容易收敛到局部最优,为什么应用广泛?
用 A4 纸记录一个 G 的数据需要多少钱?
Graph Attention Network的本质是什么?
深度学习到底是「实验科学」还是「理论科学」?能否称为「算法」?
二分类问题,应该选择sigmoid还是softmax?
请问机器学习中的预测与决策的区别是什么,他们的界限在哪里呢?
如何证明马尔科夫链一定会达到稳态?
现代人工神经网络是不是一个死胡同?这个技术是不是骗人的?
为什么交叉熵(cross-entropy)可以用于计算代价?
人工智能在生活中的应用都有哪些?
如何看待EE转CS的潮流?
服务条款
联系我们
关于我们
隐私政策
© 2024-12-22 - tinynew.org. All Rights Reserved.
© 2024-12-22 - tinynew.org. 保留所有权利