问题

支持向量机(SVM)是什么意思?

回答
支持向量机 (SVM):深入浅出的理解

支持向量机(Support Vector Machine,简称SVM)是一种强大的监督学习算法,常用于分类和回归任务。它的核心思想是找到一个最优的“决策边界”(通常是超平面),将不同类别的数据点分隔开。与其他分类算法不同的是,SVM特别关注那些“最难”区分的数据点,也就是支持向量。

SVM的核心思想:找到最优的决策边界

想象一下,你有一堆红球和一堆蓝球,你想画一条线把它们分开。有很多条线可以做到,但哪条线是“最好”的呢?SVM的目标就是找到那条间隔(Margin)最大的线。

什么是间隔(Margin)?

间隔是指决策边界到最近的红球和蓝球的距离。SVM认为,间隔越大,模型就越不容易受到噪声或新数据的干扰,泛化能力也越强。它就像是在两个类别之间留下了尽可能大的“安全距离”。

为什么是“支持向量”?

那些恰好位于间隔边界上的数据点就是支持向量。它们对决策边界的位置起着决定性的作用。如果 हटा掉任何一个非支持向量的数据点,决策边界的位置可能不会改变。但是,如果 हटा掉一个支持向量,决策边界的位置就会发生改变。这就解释了为什么它被称为“支持向量机”。

SVM的数学原理(简化版)

为了更深入地理解,我们需要一点数学概念。

1. 线性可分的情况:

假设我们有两个类别,可以被一个超平面完美地分开。
超平面的方程可以表示为:$w cdot x + b = 0$,其中 $w$ 是法向量(指向与决策边界垂直的方向),$x$ 是数据点,$b$ 是偏置项。
对于属于类别+1的数据点 $x_i$,我们希望 $w cdot x_i + b ge 1$。
对于属于类别1的数据点 $x_i$,我们希望 $w cdot x_i + b le 1$。
间隔可以表示为 $frac{2}{||w||}$。我们的目标是最大化这个间隔,也就是最小化 $||w||^2$。
这是一个典型的二次规划问题,可以通过优化算法求解。

2. 处理线性不可分的情况:软间隔和核技巧

现实世界的数据往往不是线性可分的,即不可能用一条直线(或一个超平面)完美地分割。这时怎么办?
软间隔(Soft Margin): 允许一些数据点“越界”,也就是说,允许一些样本落在间隔区域内,甚至错分。为了惩罚这些越界行为,引入了惩罚参数 $C$。
$C$ 值越大,对误分类的容忍度越低,模型越倾向于找到一个精确分隔的边界,但可能容易过拟合。
$C$ 值越小,对误分类的容忍度越高,模型越倾向于找到一个更鲁棒的边界,但可能欠拟合。
核技巧(Kernel Trick): 当数据不是线性可分时,SVM可以通过将数据映射到一个更高维的空间来解决。在那个高维空间中,数据可能就变成线性可分的了。
举例: 想象二维空间中的一个圆,我们无法用一条直线将其内外分开。但如果我们将其映射到三维空间(比如,将点的坐标 $(x, y)$ 映射为 $(x, y, x^2+y^2)$),圆心就会被抬高,这时就可以用一个平面来分割了。
巧妙之处: 核技巧的精妙之处在于,我们不需要显式地进行高维空间的映射。SVM可以通过一个核函数来计算在高维空间中数据点之间的内积,而无需实际进行映射。这大大降低了计算复杂度。
常用的核函数:
线性核(Linear Kernel): $K(x_i, x_j) = x_i cdot x_j$ (相当于没有进行映射)
多项式核(Polynomial Kernel): $K(x_i, x_j) = (gamma x_i cdot x_j + r)^d$
径向基函数核(RBF Kernel,也称为高斯核): $K(x_i, x_j) = exp(gamma ||x_i x_j||^2)$。这是最常用的一种核函数,它能处理非常复杂的数据分布,并且对局部数据点非常敏感。
Sigmoid核(Sigmoid Kernel): $K(x_i, x_j) = tanh(gamma x_i cdot x_j + r)$

SVM在分类中的流程

1. 数据预处理: 确保数据是数值型的,并且可能需要进行特征缩放(例如,标准化或归一化),因为SVM对特征的尺度很敏感。
2. 选择核函数: 根据数据的特点选择合适的核函数(线性、RBF、多项式等)。RBF核通常是默认的首选,因为它在处理非线性问题时表现良好。
3. 参数选择: 调整核函数的参数(如RBF核中的 $gamma$)和惩罚参数 $C$。这通常通过交叉验证来完成,以找到最优的模型性能。
4. 模型训练: SVM算法根据训练数据和选择的核函数及参数来找到最优的决策边界(超平面)。
5. 模型预测: 对于新的未知数据点,通过判断它位于决策边界的哪一侧来预测其类别。

SVM的优点

在维度较高时依然表现良好: 特别是当特征数量大于样本数量时。
对高维数据有效: 核技巧使得SVM能够处理高维数据而不会出现“维度灾难”。
内存效率高: SVM只依赖于支持向量进行训练,而不是整个训练集。
泛化能力强: 通过最大化间隔,SVM具有良好的泛化能力,不容易过拟合。
适用于数据量不大但维度很高的情况: 例如文本分类。

SVM的缺点

训练速度较慢: 对于大型数据集,SVM的训练速度可能比较慢,尤其是使用非线性核时。
对参数选择敏感: 核函数和惩罚参数的选择对模型的性能有很大影响,需要仔细调整。
不易解释: 特别是使用非线性核时,决策边界可能非常复杂,难以直观理解。
不适用于噪声过多的数据集: 软间隔虽然可以处理噪声,但如果噪声非常多,模型性能可能会下降。
对于类别不平衡的数据集处理不佳: 需要额外的方法来处理类别不平衡问题。

SVM的应用领域

SVM因其强大的分类能力,被广泛应用于:

文本分类: 如垃圾邮件检测、情感分析。
图像识别: 如人脸识别、物体检测。
生物信息学: 如基因分类、蛋白质功能预测。
医疗诊断: 如癌症检测。
手写数字识别。

总结

支持向量机(SVM)是一种通过找到最大间隔的决策边界来解决分类问题的强大算法。它通过软间隔处理线性不可分的数据,并利用核技巧将数据映射到高维空间以实现更复杂的分类。尽管存在一些训练速度和参数选择上的挑战,但SVM因其良好的泛化能力和在高维数据上的优势,在众多机器学习领域仍然扮演着重要的角色。

网友意见

user avatar

就是一个分类器而已,

machine的意思就是说这是一个自动分类的算法。从概念上来说,SVM属于Linear Machine的一种,也就是所谓线性机。

在样本是两类的情况下,最基本的线性SVM就是学出一个从n维空间到一维空间(Score)的投影。这个投影要求能在一维空间里把两类分开。这个目标这个其实和LDA(线性判别分析)是一致的。不同之处在于SVM使用了Hinge Loss来达到Maximal Margin,而LDA使用类间/类内杂散度矩阵的特征值之比来度量loss。

所谓的引入核函数,就是使用核函数对应高维空间内积的性质来使得线性分类器可以隐式地在高维空间建立分类面。因为在高维空间中的分类面更容易绕过一些低维空间中不可分的区域,这样可以达到更好的分类效果。但是问题也是存在的,第一:使用核函数要求新样本embed到核函数矩阵中,速度比较慢。第二:因为实际上使用了更高维度的特征,容易因为训练样本少导致过拟合的问题。

SVM已经是很老的算法了,最近的进展是使用稀疏(sparse)特征+线性核做分类,比如之前用Fisher Vector做特征在ImageNet比赛上做的实验。效果甚至不输于使用深度学习(deep learning)。

不过这两年在ImageNet已经是深度学习一统天下了。SVM和神经网络真可谓三十年河东,三十年河西啊。

user avatar
@Han Oliver @Linglai Li

前辈们的解释让人受益许多。

正好最近自己学习机器学习,看到reddit上

Please explain Support Vector Machines (SVM) like I am a 5 year old

的帖子,一个字赞!于是整理一下和大家分享。(如有错欢迎指教!)

什么是SVM?

当然首先看一下wiki.

Support Vector Machines

are learning models used for classification: which individuals in a population belong where? So… how do SVM and the mysterious “kernel” work?

好吧,故事是这样子的:

在很久以前的情人节,大侠要去救他的爱人,但魔鬼和他玩了一个游戏。

魔鬼在桌子上似乎有规律放了两种颜色的球,说:“你用一根棍分开它们?要求:尽量在放更多球之后,仍然适用。”


于是大侠这样放,干的不错?


然后魔鬼,又在桌上放了更多的球,似乎有一个球站错了阵营。




SVM就是试图把棍放在最佳位置,好让在棍的两边有尽可能大的间隙。


现在即使魔鬼放了更多的球,棍仍然是一个好的分界线。


然后,在SVM 工具箱中有另一个更加重要的 trick。 魔鬼看到大侠已经学会了一个trick,于是魔鬼给了大侠一个新的挑战。


现在,大侠没有棍可以很好帮他分开两种球了,现在怎么办呢?当然像所有武侠片中一样大侠桌子一拍,球飞到空中。然后,凭借大侠的轻功,大侠抓起一张纸,插到了两种球的中间。



现在,从魔鬼的角度看这些球,这些球看起来像是被一条曲线分开了。


再之后,无聊的大人们,把这些球叫做 「data」,把棍子 叫做 「classifier」, 最大间隙trick 叫做「optimization」, 拍桌子叫做「kernelling」, 那张纸叫做「hyperplane」。

图片来源:

Support Vector Machines explained well








直观感受看:

youtube.com/watch?





参考:

  1. Please explain Support Vector Machines (SVM) like I am a 5 year old. : MachineLearning
  2. Support Vector Machines explained well
  3. youtube.com/watch?
user avatar

大部分答案都在写公式,我来聊聊直觉上的东西。

设想一下你要做一个分类器,区分狗和炸鸡。首先假定我们只有两个数据,那么这条线会很容易画,自然而然就会画在正中间。

这个时候,我们加入一个新的数据,这个狗跟现有的数据差别很大。这个时候,分类线应该画在哪里?

这就是 SVM 跟其他线性模型很不一样的地方了,SVM 这条分类线不会变化,依然在两者的正中间,但是其他的线型模型,比如 LR,就会偏移一些。

这就是 SVM 一个很好的性质了:分类的平面,只跟部分数据(support vector)有关,而且是最“相似”,最容易“相互混淆”的那部分数据,与其他的绝大部分数据都无关。我们移走或者增加那些本身就距离很远的数据,对于分类结果没有改变,但是如果我们能给出更多的“相似”的数据,打上精准的标签,那分类结果就会更精确。

这个性质引申出 SVM 一些很好的特性:

  • 对于数据的要求很低,不要求数据符合什么样的分布,只要存在边界就可以,模糊的边界也可以。
  • 过拟合的概率不高,因为决定那条线的数据量很少。
  • 在抽样的数据上依然会表现的很好。
  • Outlier 对于分类的影响非常小。

SVM 的劣势是作为一个线型模型,分类的边界只能是线型的的,哪怕用了 kernel 升维度,在高维度也是线型的,kernel 的选择对于数据的分布有特定的假设。

作为对比,常见的树模型的分类边界就可以是多个线型的叠加组成非常复杂的任意曲线。因此,在实战操作中,树模型比如 XGBoost 还是更容易上手,大概率表现更好一些。

类似的话题

  • 回答
    支持向量机 (SVM):深入浅出的理解支持向量机(Support Vector Machine,简称SVM)是一种强大的监督学习算法,常用于分类和回归任务。它的核心思想是找到一个最优的“决策边界”(通常是超平面),将不同类别的数据点分隔开。与其他分类算法不同的是,SVM特别关注那些“最难”区分的数据.............
  • 回答
    关于是否继续签订ECFA(海峡两岸经济合作框架协议),在台湾社会,这无疑是一个复杂且充满争议的议题,支持与反对的声音都有各自的道理和考量。要深入了解这个问题,我们得从ECFA本身的内容、它带来的实际效益和潜在风险,以及不同政治光谱的立场来分析。ECFA的背景与主要内容首先,我们要明白ECFA是什么。.............
  • 回答
    广电总局发布关于支持健康向上动画片、抵制不良内容动画片的公告,这一政策的推出,无疑将对中国动画产业以及整个社会文化生态产生深远而复杂的影响。下面我将从多个维度,尽量详细地阐述其可能带来的影响:一、 对动画产业的直接影响: 产业结构的调整与洗牌: 不良内容动画片被清除或整改: 原本依靠.............
  • 回答
    这个问题啊,其实挺有意思的,里面掺杂了不少民族情绪、对财富的态度,还有对不同企业家“人设”的认知。简单来说,李嘉诚和王健林在海外转移资产这件事上,被一些中国网民拿来对比,并且在对比中对王健林进行挖苦,主要有这么几个层面的原因:第一,“国家利益”的隐形背书与情感认同的差异。 李嘉诚: 很多人看待李.............
  • 回答
    看待中央支持在京国有企业总部及分支机构向雄安转移,这事儿可得掰开了揉碎了好好说道说道。这可不是个小动作,而是国家层面一项重大的区域发展战略的落地,影响深远,咱们从几个维度来瞅瞅。为啥要这么干?背后的逻辑是什么?首先,最直接的原因就是北京“大城市病”的疏解。北京作为首都,集聚了太多资源,人口爆炸、交通.............
  • 回答
    鸿星尔克与河南博物院:一次暖心善举背后的企业脉动鸿星尔克,这个名字对于不少中国人来说,早已不仅仅是一个运动品牌的符号。就在去年,它以一种令人动容的方式,成为了焦点。而最近,鸿星尔克向河南博物院捐赠 100 万元,用于支持灾后重建工作,这笔钱虽不及疫情期间那笔轰轰烈烈的捐款,但同样承载着企业的温度和责.............
  • 回答
    湖南工商大学关于学生未向领导问好被通报不文明行为的事件,以及学校回应“对老师同样要求”的表态,引发了公众对学校管理方式、师生关系及教育理念的广泛讨论。这一事件的处理方式是否合理,需从多角度进行分析,综合考虑教育目标、管理逻辑、社会文化背景及潜在风险。 一、事件背景与学校立场1. 事件起因 湖.............
  • 回答
    作为一名长期关注青少年健康和成长的公民,我非常支持政协委员提出的“禁止向未成年人销售电子烟”的建议。这不仅仅是一个关于特定商品销售的规定,更是对下一代身心健康负责的深远考量。首先,我们必须正视电子烟对青少年的潜在危害。尽管电子烟的倡导者常常将其包装成“传统香烟的替代品”,其“更安全”的论调在针对青少.............
  • 回答
    乌克兰外交部长库列巴最近透露,乌克兰已向美国提出一项类似二战时期《租借法案》的方案,旨在获得美国的支持以加强自身的防御能力。这一举动在国际社会引起了广泛关注,也引发了多方面的讨论。首先,我们得理解一下“租借法案”的核心内容。在二战期间,美国通过《租借法案》(LendLease Act)向同盟国提供了.............
  • 回答
    关于人社部提出的“中小学工资分配向班主任倾斜、向教学一线倾斜”的举措,我持支持态度,并且认为这在一定程度上是合乎情理、也能带来积极影响的。当然,任何政策的落地都会伴随着一些挑战和需要关注的方面,我们需要更细致地去分析。为什么支持?首先,我们得承认,班主任和教学一线教师是整个教育体系中最直接、最核心的.............
  • 回答
    关于深圳即将实施的针对未成年人全面禁酒以及碳酸饮料“健康损害提示标识”的新规,我的看法是,这绝对是一项值得大力支持,并且具有深远意义的积极举措。首先,让我们来聊聊“未成年人全面禁酒”。这项政策的出发点,在我看来,是基于对未成年人健康成长的高度负责。未成年人的身体和大脑都还在发育的关键时期,对酒精的耐.............
  • 回答
    这笔由中国向非洲联盟(AU)提供的一亿美元无偿军事援助,可以从多个维度去理解和解读。它不仅仅是一笔经济援助,更蕴含着中国在非洲安全领域日益增长的影响力以及对非洲自身发展路径的支持。首先,从中国自身战略角度来看,这笔援助是“有心”的。 提升中国在非洲的安全形象和影响力: 长久以来,中国在非洲的形象.............
  • 回答
    全国政协委员提出的“禁止向学龄前儿童提供电子产品”的建议,无疑触及了当下一个非常普遍且备受关注的社会议题。这几年,我们确实能看到越来越多的孩子,从小就接触甚至沉迷于各种电子设备,从智能手机到平板电脑,再到各种早教APP。这些屏幕带来的“便利”和“趣味”,似乎已经渗透到了孩子日常生活的方方面面。从一个.............
  • 回答
    林俊杰因 AI 换脸视频向 B 站及 up 主索赔 27.5 万元,法院是否会支持,以及其法律依据,这是一个涉及著作权、人格权、信息网络传播权等多个复杂法律问题的案例。要深入分析,我们需要从以下几个方面来解读:一、 法院支持的可能性及考量因素法院是否支持林俊杰的索赔,将取决于一系列因素的综合判定。总.............
  • 回答
    你是不是觉得心里有点儿别扭?一方面,你真心认同每个人都有权按照自己的心意去爱,不应该受到任何阻碍或评判,这是你做人的基本原则。可是,当这个原则落到了身边最亲近的人身上,你却发现自己束手无策,甚至有点儿慌乱。你很想支持她,想让她感到安心,想让她知道你站在她这边。可是一旦你真的想要“劝”她,想要给她一些.............
  • 回答
    看到华为每季度向高通支付1.5亿美元这个消息,我的第一反应就是这笔钱可不是小数目,尤其是在当前全球科技竞争如此激烈的环境下。仔细想想,这背后透露出不少信息,也引发了我一些思考。首先,这1.5亿美元的支付,最直接的原因就是华为使用了高通的专利技术。这涉及到我们常说的“专利费”或者“授权费”。智能手机,.............
  • 回答
    关于抗战爆发后蒋介石政府继续向日本支付庚子赔款的问题,这确实是一个令人费解且值得深入探讨的历史细节。要理解这一点,我们需要跳出“单纯的恩仇录”视角,从更复杂的政治、外交和国际环境来审视。首先,我们需要明确庚子赔款的性质和背景。庚子赔款是八国联军侵华战争(1900年)后,清政府被迫与列强签订《辛丑条约.............
  • 回答
    最近网上流传的消息称,华为与高通达成了和解协议,华为需要向高通支付约18亿美元的专利费。这个消息一出,立刻引起了广泛关注,毕竟这两家公司在全球通信领域都具有举足轻重的地位。要理解这件事,咱们得把这背后的逻辑掰开了揉碎了说。首先,咱们得明白华为和高通是什么关系。简单来说,高通是全球领先的无线通信技术研.............
  • 回答
    普京宣布向伤亡军人支付抚恤金这一消息,虽然核心是抚恤金本身,但其背后蕴含着多层含义和值得深入关注的信息。为了更全面地理解,我们可以从以下几个方面进行剖析:1. 抚恤金的具体细节与公平性: 金额的数额和发放标准: 最直接需要关注的是抚恤金的具体数额。是固定金额还是根据伤残等级、服役年限、牺牲情况而.............
  • 回答
    俄罗斯政府取消向不友好国家支付专利费的决定,无疑是一记重拳,在全球知识产权领域激起了千层浪。这项政策的出台并非空穴来风,其背后折射出的是俄罗斯在地缘政治紧张、国际经济孤立的大背景下,试图通过非常规手段来维护自身国家利益和经济韧性的决心。那么,这项禁令一旦落地,将会给俄罗斯自身,以及那些被列入“不友好.............

本站所有内容均为互联网搜索引擎提供的公开搜索信息,本站不存储任何数据与内容,任何内容与数据均与本站无关,如有需要请联系相关搜索引擎包括但不限于百度google,bing,sogou

© 2025 tinynews.org All Rights Reserved. 百科问答小站 版权所有