首页

为什么softmax很少会出现[0.5，0.5]？第1页

1

wang-feng-98-82 网友的相关建议:

因为训练的时候你没有跟网络说什么样的东西应该不确定。

你只给了确定的label，要么是[0,1]要么是[1,0]，那网络就只会出接近这两个值的输出。

-----------------分界线------------------

当然这背后是有数学原理的，二分类的softmax其实等价于sigmoid，如果一直给one-hot的标签，在训练集几乎都能分正确的前提下，网络趋向于将feature的norm无限拉长，sigmoid越来越接近0-1的阶跃函数，几乎所有样本的输出就都在接近0和接近1的位置，中间态几乎没有。

注意这里引入了一个假设，即“训练集几乎都能分正确”。如果你的训练集拟合得不好，你会发现输出0.3、0.5之类的样本的机会会大大增加。

-----------------分界线------------------

怎么告诉网络不确定性呢？

有两种方式：一种是soft label，即你直接就给部分样本[0.5, 0.5]的label；一种是noise label，就是你觉得不确定的东西，一会给0的label，一会给1的label。

这两种方式都可以起作用，当然第一种效果更好一些，网络有比较明确的目标，第二种方式在batch training下其实也是有效的，只是看起来比较奇怪。

为什么softmax很少会出现[0.5，0.5]？的其他答案点击这里

1

相关话题

  如何看待 Google 围棋 AI AlphaGo 击败欧洲围棋冠军？
  如何简单形象又有趣地讲解神经网络是什么？
  为什么谈论深度学习工具时，很少有人讨论matlab的神经网络工具包？
  为什么梯度下降能找到最小值？
  深度学习中，模型大了好还是小了好呢？
  为什么谈论深度学习工具时，很少有人讨论matlab的神经网络工具包？
  多模态训练，怎么解决不同模态之间差异的问题？
  为什么熵值最大的分布状态是正态分布而不是均匀分布？
  目前 AI 在疾病的诊断和治疗上，有哪些成功的应用？
  请解释下variational inference？

前一个讨论

目前 AI 在疾病的诊断和治疗上，有哪些成功的应用？

下一个讨论

一位合格的博士生需要有哪些条件和素质？

相关的话题

  从今年校招来看，机器学习等算法岗位应届生超多，竞争激烈，未来 3-5 年机器学习相关就业会达到饱和吗？
  Linear least squares, Lasso,ridge regression有何本质区别？
  为什么CV能做到让一幅人脸图动了笑了，而NLP的text-style-transfer进展貌似一般？
  如何看待KDD'21的文章，异质图神经网络的效果不如简单的GCN、GAT？
  测试集在构造的时候需要人为控制其中应该正确的和应该错误的数据比例吗？
  如何比较Keras, TensorLayer, TFLearn ？
  如何评价 DeepMind 的新工作 AlphaCode?
  AAAI 2022有哪些值得关注的方向？
  Resnet是否只是一个深度学习的trick？
  如何看待AI伦理科学家Timnit Gebru在邮件控诉谷歌缺乏种族多样性后被Jeff Dean炒掉？
  如何评价 MXNet 被 Amazon AWS 选为官方深度学习平台？
  如何评价Hinton组的新工作SimCLR?
  请问一下，机器学习领域的联邦学习技术，目前看到最多的是微众银行，国内还有哪些顶级专家及机构和大学？
  如何才能看得懂变分贝叶斯方法（Variational Bayesian）？
  人脑有海量的神经元（参数），那么人脑有没有「过拟合」行为？
  阿里的TDM树深度模型为什么很少有人用，是有哪些问题吗？
  如何评价微软亚洲研究院提出的LightRNN？
  什么是迁移学习 (Transfer Learning)？这个领域历史发展前景如何？
  如何评价深度学习之父Hinton发布的Capsule论文？
  机器全面代替人工劳动力的那一天，你能如何生存下去？
  nlp有哪些值得完整实现一遍的算法?
  三位物理学家与陶哲轩发现的特征向量全新求解公式，会给机器学习领域带来怎样的变化？
  一个完整的Pytorch深度学习项目代码，项目结构是怎样的？
  多任务学习成功的原因是引入了别的数据库还是多任务框架本身呢？
  如何看待指出神经网络的训练罪魁祸首是退化一文？
  OpenAI 发布文字生成图像工具 DALL·E 2，它的画作水平如何？从技术角度如何评价它的能力？
  CTC和Encoder-Decoder有什么关系?
  研一，在学机器学习和深度学习，为什么感觉越学越不会，怎么解决这个问题？
  请问应该怎样去学习图像识别和深度学习？
  如何评价周志华在微博对 AlphaGo 和机器学习技术的评论？

© 2025-07-01 - tinynew.org. All Rights Reserved.
© 2025-07-01 - tinynew.org. 保留所有权利