百科问答小站 logo
百科问答小站 font logo



神经网络,分类和回归问题,在网络结构上的区别是什么?分类比回归多一层softmax吗?诚心求教? 第1页

  

user avatar   huo-hua-de-41 网友的相关建议: 
      

感觉现在已有的回答还没说到点上。例如,0-1的回归,我把0-1分成100个bin,每0.01当作一个类,然后用变成100类的分类任务,是不是就只是精度差异呢?进一步可以衍生几个问题:

  • 为什么回归任务常使用mse作为损失函数?
  • 为什么分类任务常用交叉熵作为损失函数?

首先,我们要知道,使用特定损失函数的前提是我们对标签的分布进行了某种假设

二分类问题的常见假设就是标签服从伯努利分布,多分类问题背后的假设是多项分布(Multinomial Distribution)。根据数据分布,结合最大似然估计就可以推导出交叉墒的公式。

同样的,回归问题背后的假设是标签服从正态分布,这时候根据数据分布,结合最大似然估计就可以推导出mse的公式。

然后实际问题中,我们遇到的标签不一定真的服从正态分布。根据样本分布不同,大家还提出了tweedie loss、possion loss等损失函数替代mse。我说这么多,只是抛砖引玉,详细的推到大家可以看看 @马东什么 的文章




  

相关话题

  5-10年后,你觉得哪些科技会让我们“遗忘”现在的生活? 
  机器学习相关岗位面试中,有哪些加(zhuang)分(bi)项? 
  Partial Multi-Label Learning是什么?它的发展史又是怎样的?最新的进展如何? 
  如何评价李飞飞和李佳加盟谷歌? 
  如何评价Hinton在加拿大多伦多大学关于用“capsule”作为下一代CNN的演讲? 
  一般来说,三层神经网络可以逼近任何一个非线性函数,为什么还需要深度神经网络? 
  本科数学,目前在读计算机研一,毕业的时候想要应聘数据挖掘工程师,看了对数据挖掘工程师的招聘要求,感觉太宽泛了,希望能具体说一下现在应该准备哪些知识(算法?编程语言?其他?),谢谢! 
  各种机器学习算法的应用场景分别是什么(比如朴素贝叶斯、决策树、K 近邻、SVM、逻辑回归最大熵模型)? 
  各种机器学习算法的应用场景分别是什么(比如朴素贝叶斯、决策树、K 近邻、SVM、逻辑回归最大熵模型)? 
  在迁移学习中,只有fine-tune和基于实例的迁移可用在小样本上吗,还有其他的小样本迁移方法吗? 

前一个讨论
python中[[3,5],[2,3]]怎么转化为[['3','5'],['2','3']]?
下一个讨论
对于智力和勤奋程度都一般的人来说,博士毕业有多难?





© 2025-01-31 - tinynew.org. All Rights Reserved.
© 2025-01-31 - tinynew.org. 保留所有权利