百科问答小站 logo
百科问答小站 font logo



既然使用神经网络也可以解决分类问题,那SVM、决策树这些算法还有什么意义呢? 第1页

  

user avatar   insulator 网友的相关建议: 
      

谢邀,赞同 @mileistone 的回答,没有一个模型是万能的,需要根据数据选择适合的模型。

在机器学习中,数据大概可以分成四大类:图像 (Image),序列(Sequence),图(Graph) 和表格(Tabular) 数据。其中,前3类数据有比较明显的模式,比如图像和图的空间局部性,序列的上下文关系和时序依赖等。而表格数据常见于各种工业界的任务,如广告点击率预测,推荐系统等。在表格数据中,每个特征表示一个属性,如性别,价格等等,特征之间一般没有明显且通用的模式。

神经网络适合的是前三类数据,也就是有明显模式的数据。因为我们可以根据数据的模式,设计对应的网络结构,从而高效地自动抽取“高级”的特征表达。如常见的 CNN (卷积神经网络) 就是针对图像而设计的,RNN (循环神经网络) 是为序列数据而设计的。而表格数据,因没有明显的模式,非要用神经网络的话,就只能用低效的全连接网络,一般效果都不太好。在实践中,对于表格数据,除了专门对特定任务设计的网络结构如DeepFM等,更多时候还是用传统机器学习模型。尤其是 GBDT (梯度提升树),因其自动的特征选择能力及动态的模型复杂度,算得上是一个万金油模型,在各种类型的表格数据上都表现很好。但对于表格数据而言,其实特征工程才是更关键的。在给定数据的情况下,模型决定了下限,特征决定了上限。特征工程类似于神经网络的结构设计,目的是把先验知识融入数据,并且让模型更好地理解数据,让模型可以学得更好。

另外,神经网络实质上不算是一个模型,而是一类可以自由“搭积木”的模型。结构不同的神经网络可以认为是不同的模型了。

总结下,no free lunch,没有一个万能的模型,可以直接用于各种数据。有多少人工就有多少智能:用神经网络的话,你需要结构设计;而用传统模型的话,你需要特征工程。


user avatar   lwl1127 网友的相关建议: 
      

女王:求求题主放过我,我可不敢有什么政绩。。。


user avatar   mileistone 网友的相关建议: 
      

女王:求求题主放过我,我可不敢有什么政绩。。。




  

相关话题

  如何评价百度自动驾驶 ApolloAuto 在 Github 上发布的代码? 
  将并行计算纳入算法竞赛,是否合适? 
  开发一个 App,利用 Bose 降噪耳机的原理实现其功能? 
  为什么deep lab v3起,输出不再接 DenseCRF了? 
  如何评价阿里巴巴启动NASA计划? 
  有没有哪些人工的工作是无法被机器替代的? 
  如何评价百度自动驾驶 ApolloAuto 在 Github 上发布的代码? 
  正负样本极不平衡的问题? 
  你在生活中用过最高端的数学知识是什么? 
  有哪些深度学习效果不如传统方法的经典案例? 

前一个讨论
怎么写文献综述?
下一个讨论
如何评价MSRA视觉组最新对spatial attention mechanism分析论文?





© 2025-02-07 - tinynew.org. All Rights Reserved.
© 2025-02-07 - tinynew.org. 保留所有权利