首页

神经网络，分类和回归问题，在网络结构上的区别是什么？分类比回归多一层softmax吗？诚心求教？第1页

1

huo-hua-de-41 网友的相关建议:

感觉现在已有的回答还没说到点上。例如，0-1的回归，我把0-1分成100个bin，每0.01当作一个类，然后用变成100类的分类任务，是不是就只是精度差异呢？进一步可以衍生几个问题：

为什么回归任务常使用mse作为损失函数？
为什么分类任务常用交叉熵作为损失函数?

首先，我们要知道，使用特定损失函数的前提是我们对标签的分布进行了某种假设。

二分类问题的常见假设就是标签服从伯努利分布，多分类问题背后的假设是多项分布（Multinomial Distribution）。根据数据分布，结合最大似然估计，就可以推导出交叉墒的公式。

同样的，回归问题背后的假设是标签服从正态分布，这时候根据数据分布，结合最大似然估计，就可以推导出mse的公式。

然后实际问题中，我们遇到的标签不一定真的服从正态分布。根据样本分布不同，大家还提出了tweedie loss、possion loss等损失函数替代mse。我说这么多，只是抛砖引玉，详细的推到大家可以看看 @马东什么的文章

神经网络，分类和回归问题，在网络结构上的区别是什么？分类比回归多一层softmax吗？诚心求教？的其他答案点击这里

1

相关话题

  在迁移学习中，只有fine-tune和基于实例的迁移可用在小样本上吗，还有其他的小样本迁移方法吗？
  为什么小模型已经可以很好地拟合数据集了，换大模型效果却要比小模型好？
  R 中的哪些命令或者包让你相见恨晚？
  相比于时下流行的机器学习方法（联接主义），传统的人工智能方法（符号主义）有什么独一无二的优势？
  默写很花时间怎么办？
  目前手势识别发展到什么水平了？
  可以对只有一个像素的图片拥有版权或著作权吗？为什么？
  基于深度卷积神经网络进行人脸识别的原理是什么？
  请问机器学习中的预测与决策的区别是什么，他们的界限在哪里呢？
  研一，在学机器学习和深度学习，为什么感觉越学越不会，怎么解决这个问题？

前一个讨论

python中[[3,5],[2,3]]怎么转化为[['3','5'],['2','3']]？

下一个讨论

对于智力和勤奋程度都一般的人来说，博士毕业有多难？

相关的话题

  为什么要学习吴恩达的机器学习？
  为什么交叉熵（cross-entropy）可以用于计算代价？
  如何评价 Kaiming 团队新作 Masked Autoencoders (MAE)？
  欧洲有哪些统计机器学习比较强的大学或者研究院的？？
  怎样计算两个服从高斯分布的向量乘积的期望？
  在机器学习中，L2正则化为什么能够缓过拟合？
  为啥gan里面几乎不用pooling？
  机器学习中的PR曲线一定会过（1，0）这个点吗？
  如何评价Sony新出的深度学习库NNabla？
  能否介绍一下强化学习（Reinforcement Learning），以及与监督学习的不同？
  深度学习在无人驾驶汽车上面的运用有哪些？
  运维监控的KPI异常检测业界有哪些实用方法？
  统计模型和概率模型的区别是什么呢？
  2021 年了，机器/深度学习还有哪些坑比较好挖？
  如何对用户进行聚类分析？
  未来20年，新技术将从哪些方面改变人的消费方式？
  机器学习里的 kernel 是指什么？
  深度学习工作站中使用AMD的CPU会有问题吗？
  你见过最差的算法工程师能差到什么程度？
  如何理解Inductive bias？
  深度学习方面还有什么Open Problem?
  为什么计算机科学专业背景的人喜欢黑机器学习？
  金融学及金融从业者如何应对人工智能和大数据？
  如果人工智能迎来下一个寒冬，你认为会是卡在什么问题上？
  近几年有哪些关于机器学习中隐私（Privacy）和安全（Security）相关的研究值得关注?
  卷积神经网络如果将池化层去除，与神经网络的区别还大么？
  为什么我用相同的模型，数据，超参，随机种子，在两台服务器会得到不同的结果？
  如何理解链接预测（link prediction）？
  如何评价 2018 清华大学特等奖学金计算机大类（贵系、软院、姚班）无人通过一轮筛选？
  机器学习领域是否已经达到饱和？

© 2025-05-02 - tinynew.org. All Rights Reserved.
© 2025-05-02 - tinynew.org. 保留所有权利