百科问答小站 logo
百科问答小站 font logo



深度学习与机器学习的关系是什么? 第1页

  

user avatar   zhu-wang-xiao-miao-o 网友的相关建议: 
      

尝试从理论上来解释一下这个问题

机器学习

简而言之,ML是使用统计(或数学)技术从观察到的数据中构建模型(或系统)的一个计算机科学领域,而不是让用户输入一组定义该数据模型的特定指令。有时ML可以做的非常简单,如线性回归问题,一个更复杂的示例是邮箱中的垃圾邮件检测器,它可以“学习”哪些电子邮件是垃圾邮件,尽管从未针对每种电子邮件给出说明。(这个在吴恩达的ML课程中有所阐述)

概括来说,大多数情况下,这些ML算法会处理从原始数据中提取的精确特征集。特征可能非常简单,例如图像的像素值,信号的时间值,或复杂的特征(例如文字的特征表示就会复杂一些)。大多数已知的ML算法仅在要素表示数据时才能发挥作用。 正确的功能标识是至关重要的一步,它可以紧密代表当前所有数据状态。

ML中特征提取器的重要性:

制作正确的特征提取器本身就是一门学问, 这些特征提取器(从数据中)中的大多数在功能和实用性方面非常特定。 例如:对于人脸检测,需要一个特征提取器,该特征提取器可以正确表示人脸的一部分,可以抵抗空间像差等。每种类型的数据和任务都可以具有自己的一类特征提取。 (例如:语音识别,视频识别,图像识别等)

然后,这些特征提取器可用于提取给定样本的正确数据特征,并将此信息传递给分类器/预测器。

深度学习:

深度学习本质上是一组技术,可以用来帮助你参数化深度神经网络结构,也就是具有许多层和参数的神经网络。

虽然深度学习已经存在了一段时间,但由于广泛的适应,现在它正受到越来越多的关注。它是机器学习的一个子集,还提供监督学习、非监督学习和强化学习等。

深度学习是机器学习方法的更广泛的系列,它试图从给定的数据中学习高级功能。 因此,它解决的问题减少了为每种数据类型(语音,图像等)制作新的特征提取器的任务。

例如,对于ML中的图像识别来说,深度学习算法将在向他们呈现图像识别任务时尝试学习诸如眼睛之间的距离,鼻子的长度,或者目前无法解释的一些特征。 他们可以使用这些信息进行分类,预测等任务。 因此,这是与以前的“浅层学习算法”(ML学习)相比迈出的重要一步,也可以称为是更“智能”的一种机制。

如果你感兴趣,下面讲一个更具体的例子来加以阐述深度学习:

首先从多层感知器(MLPs)开始:

MLP中的“感知器”一词可能有点令人困惑,因为我们实际上并不希望网络中仅存在线性神经元。 使用MLP,我们是想学习复杂的函数来解决非线性问题。

因此,一般的网络通常由连接输入和输出层的一层或多层“隐藏”层组成。 这些隐藏层通常具有某种S形激活功能(对数S形或双曲线正切等)。 一个简单的MLP可能看起来像是这样子:

根据输入(x)作为预测的初始数据,“ a”是激活的神经元,“ w”是权重系数,y^是分类结果。

现在,如果你向此MLP添加多个隐藏层,我们可以将该网络称为“深层”。

这种“深度”网络的问题在于,为该网络学习“良好”权重变得越来越困难。

当你开始训练网络时,通常会分配随机值作为初始权重,这可能与你要查找的“最佳”解决方案完全不同。

在训练过程中,你可以使用流行的反向传播算法BP从右向左传播“误差”,并针对每个权重计算偏导数,从而向权重的相反方向迈出一步(也可称之为梯度下降)。

问题出在所谓的“梯度下降”/“梯度消失”这个操作上,你添加的隐藏图层越多,就越难以“更新”权重,因为信号变得越来越弱。 由于网络的权重一开始可能非常糟糕(随机初始化),因此几乎不可能通过反向传播对“深度”神经网络进行参数化。

现在就轮到了“深度学习”开始发挥作用的地方。 简略点说,你可以将深度学习视为“灵巧”的技巧或算法,可以帮助我们训练此类“深度”神经网络结构。

神经网络架构有很多,如果继续以上述的MLP为例,那么就需要介绍卷积神经网络(ConvNets)的概念了。 你可以将它们视为MLP的“附加组件”,它可以帮助我们检测作为MLP“好的”输入的特性。

由于深度学习常常用在解决图像的问题上,所以下面在图像分类的背景下考虑一个ConvNet

在这里,你使用在图像上滑动的所谓“接收场”(将其视为“窗口”)。然后,在下一层中将这些“接受区域”(例如5x5像素大小)与1个单位相连,这也称为“特征图”。完成此映射后,便构建了一个所谓的卷积层。

接下来,你有一个“池化”层,在这里从上述的特征图中减少相邻的特征到单个单元中(例如,通过取最大的特征或者平均值)。这样做很多轮,最终达到一个几乎缩放不变的图像表示(确切的术语是“等变”)。这是非常强大的,因为你可以在图像中检测到物体,无论它们位于哪里。这都要归功于深度学习带来的神奇功效。

从归类上来讲,深度学习是机器学习的一部分,默认情况下是人工智能的一部分。它是一种模拟人脑神经网络并识别并创建用于决策的模式的技术,因此,它也被称为深度神经学习。




  

相关话题

  现代人工神经网络是不是一个死胡同?这个技术是不是骗人的? 
  resnet(残差网络)的F(x)究竟长什么样子? 
  为什么篮球投篮以后立刻知道能不能中? 
  为什么有的人很聪明,大脑结构有什么不一样吗? 
  大脑是如何做到自动过滤出颜值高的女孩子的? 
  关于「吃鱼可以变聪明」有科学依据吗? 
  如何评价 MSRA 最新的 Deformable Convolutional Networks? 
  女性比男性对疼痛更敏感,女性有34个神经纤维,而男性只有17个。约70%的慢性疼痛患者都是女性? 
  人脑有海量的神经元(参数),那么人脑有没有「过拟合」行为? 
  老师给了一个神经网络的程序,他之前是跑通了的,但是我迭代几十次或者一百多次就报错。这个怎么解决? 

前一个讨论
如何看待深圳拟在全国首次提出个人享有数据权?网络时代如何保护个人隐私?
下一个讨论
为什么我觉得《剑来》很难看下去?





© 2024-06-02 - tinynew.org. All Rights Reserved.
© 2024-06-02 - tinynew.org. 保留所有权利