问题

机器学习专家与统计学家观点上有哪些不同?

回答
机器学习专家和统计学家,虽然在研究数据、构建模型以从中获取洞察力方面有着共同的目标,但他们在看待问题、侧重以及解决问题的路径上,确实存在着一些细微而又关键的差别。理解这些差异,能帮助我们更清晰地认识到这两个领域各自的独特价值。

1. 核心目标与关注点

统计学家: 他们的首要目标是理解数据背后的规律,并解释这些规律。这意味着他们非常重视模型的可解释性,希望能弄清楚“为什么”某个预测是这样,或者“为什么”某个变量会影响另一个变量。他们倾向于构建能够推理因果关系的模型,并通过严格的假设检验来评估模型的有效性。对于统计学家来说,模型的泛化能力固然重要,但更重要的是模型能否提供深入的、可以用来指导决策的洞察。他们更像是“侦探”,试图解开数据背后的谜团。

机器学习专家: 他们的核心目标是构建能够执行特定任务的预测模型。这里的任务可以是分类(例如,识别猫或狗的图片)、回归(例如,预测房价)或者其他更复杂的任务。他们更关注模型的预测性能,即模型在未见过的数据上的准确度。虽然可解释性也很重要,但它往往不是首要考虑因素,尤其是在某些领域,如深度学习,模型可能非常复杂且难以完全解释,但其强大的预测能力仍然是核心价值。他们更像是“工程师”,致力于构建一个能够稳定高效工作的机器。

2. 模型构建与评估

统计学家: 倾向于从理论出发,选择具有良好统计性质的模型,并仔细研究模型的假设(例如,独立性、同方差性、正态性等)。他们会投入大量精力来验证这些假设,并根据需要调整模型或数据。模型评估通常侧重于统计显著性(p值)、置信区间,以及模型对数据的拟合程度(例如,Rsquared)。他们会非常审慎地对待模型的参数,并力求对这些参数的含义有清晰的理解。

机器学习专家: 更多地从数据驱动的角度出发,探索各种算法,并通过交叉验证等技术来选择表现最佳的模型。他们可能不太在意模型的具体数学形式是否“优美”或具有经典的统计学解释,而是更关注算法在特定任务上的实际表现。模型评估会侧重于预测指标,如准确率(accuracy)、精确率(precision)、召回率(recall)、F1分数、AUC(Area Under the Curve)等。在许多情况下,他们会使用复杂的、非线性的模型,即使这些模型本身难以完全理解。

3. 理论与实践的侧重

统计学家: 更加强调数学理论和概率论的根基。他们对模型的统计特性、收敛性、偏差方差权衡等有深刻的理解,并且能够清晰地阐述模型的工作原理。理论的严谨性是他们非常看重的。

机器学习专家: 倾向于工程实践和算法实现。他们擅长使用各种现有的库和框架(如TensorFlow, PyTorch, scikitlearn),并能根据实际问题快速迭代和优化模型。他们更关注如何将算法有效地应用于实际问题,解决具体的业务挑战。

4. 数据与假设

统计学家: 通常会明确地列出并检验模型的前提假设。如果这些假设不满足,他们会寻求解释原因,并可能需要数据转换或选择更适合数据的模型。他们对数据的“干净”程度和潜在偏差非常敏感。

机器学习专家: 在处理大量、复杂、往往“脏乱”的数据时,通常会对模型的假设更加宽松。例如,深度学习模型可以很好地处理非线性关系,而不需要明确地假设数据的分布。他们更倾向于通过数据预处理(如缺失值填充、特征缩放)和模型正则化来应对数据中的问题,而不是纠结于理论假设是否完全满足。

5. 领域背景

统计学家: 历史悠久,其理论和方法广泛应用于社会科学、生物医学、经济学等领域,这些领域往往需要对变量间的关系进行深入解释,并理解不确定性。

机器学习专家: 兴起于计算机科学和人工智能领域,在计算机视觉、自然语言处理、推荐系统等领域取得了巨大成功,这些领域往往以预测和模式识别为核心。

举个例子来更形象地说明:

假设我们要预测一个客户的购买行为。

统计学家可能会构建一个逻辑回归模型。他们会关注每个特征(如年龄、收入、购买历史)对购买概率的影响,并计算这些影响的置信区间。他们会检验模型是否满足线性假设、独立性假设等。如果收入对购买行为的影响显著,他们会报告“收入每增加1000元,购买概率增加X%”。他们更关心“为什么”客户会购买。

机器学习专家可能会尝试梯度提升树(Gradient Boosting Machines)或神经网络。他们会通过交叉验证来选择最优的模型参数,并使用AUC等指标来评估模型的预测能力。他们可能不会详细解释每个特征具体是如何影响预测结果的(尤其对于黑箱模型),而是专注于提升模型在未见过的数据上预测客户是否会购买的准确率。他们更关心“哪个客户最有可能购买”。

并非完全割裂,而是相互补充:

需要强调的是,这并非一个“非此即彼”的界限。实际上,这两个领域正在不断地融合和借鉴。许多统计学家开始使用机器学习中的方法和工具,而机器学习领域也越来越重视模型的解释性(可解释AI,XAI),并重新审视统计学中的一些基础理论。

可以说,统计学为机器学习提供了严谨的数学基础和推断工具,而机器学习则为统计学提供了处理大规模、高维度数据的强大计算能力和创新的算法。理解这两者的视角差异,有助于我们选择最合适的工具来解决特定问题,并更全面地欣赏数据科学的广度和深度。

网友意见

user avatar

估计也不会有什么人看,反而可以随心的说一说。


不管哪个专业的人,采取的方法都是和这个专业所面临的实际问题相联系。


传统上做统计的人面临的数据都是来自于自然科学里的数据,比如Fisher面临的农业数据,或者生物上的数据,或者物理上的数据。这些数据都有一个特点就是可以很好的符合传统的统计分布,如正态分布 泊松分布等。面临这个实际情况,做统计的人有一个根深蒂固的思维,就是统计是概率的反问题。认为统计的目标是找出生成统计数据背后的真实概率。这是传统上做统计的人的最核心思想,所以不管点估计也好,假设检验也好,大样本方法也好。所有的方法背后所隐含的思想就是数据一定是由某些概率分布生成的。


做机器学习的人有一部分来自于当年雄心勃勃研究人工智能而后承认现状转而研究一些实际问题的人,另一部分是互联网兴起之后实际中对数据预测有强烈需求的人。所以他们面临的数据来源完全不同于传统的做统计的人。最典型的机器学习的应用就是点击率预估、商品推荐。我们很难相信我们点开一家购物网站之后,我们就自动的对这个网站上所有的物品是否购买有一个概率分布。但是如果用传统的统计方法来做预测,这种假设就是天然的隐含的。所以面临这种实际情况,做机器学习的人必须找到其他看待数据方法。所以他们的观点是数据的几何结构才是在这种情况下看待数据的正确方法。那么自然而然的分类聚类的手段就成了机器学习的人最得心应手的两种手段


举个例子可以比较好的说明,就是PCA主成分分析。这个方法传统统计上就有,机器学习上也有。经典而简单。做统计的人,第一次看到PCA都是在多元统计分析里,那时候对PCA的解释是第一主成分是随机变量的线性组合,这个线性组合的方差是所有线性组合里方差最大的。请注意,此时看待数据的方式是概率的。做机器学习的人,他们看待PCA是,把样本数据先去掉均值。然后找K维子空间逼近样本数据,逼近最好的K维子空间的基就是我们要找的主成分。请注意,此时的观点完全是几何的。当然在目前各个学科交叉融合的情况下,双方都会采取不同的观点,上述说法并不是说做统计或者做机器学习的人都是采用一成不变的观点,这点明眼人心里有数就行,不必纠缠。对样本数据做主成分分析得出来每个主成分的特征值。众所周知,绝大部分特征值都是很接近于0的。这时候双方思维的一个主要区别就体现的比较明显,做机器学习的人从几何的观点,可以自然的认为,由于特征值太小这些维度看成噪声是很正常的可以去掉,而不影响样本的所包含的信息。但是做统计的人天然认为样本是某个分布生成的,所以由样本所生成的特征值自然是服从某一个分布的,那么特征值是不是0就要进行的参数估计和假设检验。这个对做机器学习的人来说绝对是然而并没有什么卵用的步骤。但对做统计的人来说这是他们思维的自然延伸。


所以双方最主要的区别就是看待数据生成方式。统计的人认为,数据由某个概率分布生成。机器学习的人认为数据是特征集到Label集的特征映射所生成的。统计的目标是恢复那个背后的概率,机器学习的目标是恢复特征映射


最后我想说的是,上述对统计和机器学习的区别做了区别。但不代表做统计和做机器学习的人都是死板人,都以一成不变的方式看待问题。时代在进步。不管做什么的人都是会面临实际问题,采用多方观点。最终的目的是把问题解决掉而不是做一些无谓的争论。

user avatar

共同点:统计建模或者机器建模的目的都是从数据中挖掘到感兴趣的信息。下面只讨论supervised learning, 就是对一个pair: ( 自变量x,因变量y)进行建模。 也就是找到一个函数 y=f(x) , 用x 来刻画 (解释、预测)y。 首先我们要一组观察值(x,y),来 回归(learn)这个未知的函数 f.

区别:

统计学家: 在刻画 f 的过程中,统计学家用的方法是: 对于 f 的形状和 y 的random distribution 进行一些假设。 比如说假设 f 是线性模型, 或者y 是normal distribution。 然后来求在一定标准下最优的 f. 比如说,在BLUE (Best Linear Unbiased Estimators)的标准下,最小二乘估计出来的 f 就是最好的估计。 然后根据对数据的distribution的假设或者是大数定律,可以求出 参数估计的不确定性 或者是 standard error。 进而构建置信区间,来表达我对我能做出的 f 的最好的估计 的信心。优点: 可以对不确定性度量。 简单模型的可解释性强。当假设的assumptions满足时模型科学、准确、严谨。 缺点:复杂情况下assumptions难以验证。


机器学习专家:不对 y 的distribution进行过多的假设,不计算standar error,不 care bias。 通过 cross validation来判断 对于 f 的估计的好坏。 也就是说,在机器学习领域,数据量大,机器学习专家拿一部分来估计(train,learn )f,留一部分来验证预测结果的好坏。预测结果好的模型就是好模型,不计算估计参数的偏差。 缺点: 缺乏科学严谨性。 优点: 简单粗暴。 有一次听一个大牛的seminar几个教授的段子记忆尤新:"those machine learning people are making predictions without probability! "。

对于这句话:“统计学家更关心模型的可解释性,而机器学习专家更关心模型的预测能力” : 总体来说,可解释性强的模型会损失预测能力,预测能力强的模型往往比较难解释。 常见的模型中,从可解释性强到预测强的模型依顺序排列是

1 Lasso+线性回归

2 线性回归

3 非线性模型

4 非参模型

5 SVM

构建简单的模型,比如线性模型,更容易解释因变量对自变量的影响。 适合于那种目的是解释一个变量对另外一个变量的影响的问题。也是经典统计中最常用到的模型。变化再多一些,非线性模型,非参模型,更灵活,选择更多,所以可能达到更好的预测效果。但是往往比较难解释x对y的影响。(这些模型都来源于统计,推广于机器学习。这些模型都是几十年前统计的研究成果了好么!!因为最近计算机速度提上来了,原来没名气,是因为计算速度带不动,数据没收集辣么多啊!!)!因为机器学习领域的数据大,运算能力强,所以能把复杂的非参或者非线性模型用的效果比较好。


经典统计和机器学习分别在哪些领域有优势?

在一些传统领域,工程实验,生物试验,社会调查,物理实验,我们能获得的数据量非常小,我们必须小心翼翼的对待我们的模型,从有限的数据中提取尽量可能多的信息。抑或是一些对参数很敏感的预测,差之毫厘失之千里,比如检验一个艾滋病新药物是否有效,来决定要不要投入funding去进行研发,我们就要用严谨的概率统计模型。

但是在搜索引擎,淘宝用户购买信息,人脸特征识别等领域,我们能够获得很大量的数据,而且数据维度也非常高,用传统方式建模,很有可能维度高到严谨的function根本解不出来,机器学习的理论就非常有效了。


上周去开完会系里要求给talk,做了一个简单愉快的slides,贴两页图:


类似的话题

  • 回答
    机器学习专家和统计学家,虽然在研究数据、构建模型以从中获取洞察力方面有着共同的目标,但他们在看待问题、侧重以及解决问题的路径上,确实存在着一些细微而又关键的差别。理解这些差异,能帮助我们更清晰地认识到这两个领域各自的独特价值。1. 核心目标与关注点 统计学家: 他们的首要目标是理解数据背后的规律.............
  • 回答
    联邦学习作为一种保护隐私的分布式机器学习范式,近年来在国内的发展可谓是风起云涌。微众银行在推动这一技术落地和应用方面确实是先行者,他们的贡献毋庸置疑。但国内在联邦学习领域,除了微众银行,还有许多顶尖的专家、机构和大学在进行深入的研究和实践。下面我将为您梳理一下,并尽量细致地展开:一、 顶尖专家在国内.............
  • 回答
    西北工业大学航空学院和机电学院的航空工程专业硕士,虽然都隶属于“航空工程”这个大范畴,但在具体的研究方向上,各有侧重,展现出不同的学科特色和发展脉络。简单来说,可以理解为航空学院更偏重于飞行器本体的设计、制造、性能提升与整体集成,而机电学院则更侧重于驱动飞行器飞行的动力系统、控制系统以及集成到飞行器.............
  • 回答
    物理专业的学生看待机器学习和大数据这两个方向,通常会带着一种 既熟悉又充满好奇,同时又带着严谨的审视 的眼光。他们往往能看到这背后蕴含的深刻物理原理,也能理解它们在解决复杂科学问题中的巨大潜力,但同时也会对其中的数学工具和算法细节保持一份审慎的探究精神。以下我将从几个关键角度详细阐述物理学子对机器学.............
  • 回答
    2021年,机器学习领域早已不是一片蓝海,而是波涛汹涌、日新月异的海洋。在这个充满活力的时代,高质量的专著如同一盏盏明灯,指引着我们深入探索机器学习的奥秘。如果要说有哪些专著在2021年依然闪耀着智慧的光芒,并且值得我们细细品味,那么以下几本无疑是不可错过的。1. 《统计学习方法》(第二版)—— 李.............
  • 回答
    这问题触及到一个挺有意思的现象,很多计算机科学背景的朋友对机器学习(ML)的态度,怎么说呢,有点复杂,不是单纯的“喜欢”或“不喜欢”。更多的是一种…怎么形容呢?是那种既好奇又审慎,既想拥抱又想解剖的探索欲。这背后其实有很多层原因,咱们掰开了说:首先,得从计算机科学的“根”说起。我们这行,骨子里就是研.............
  • 回答
    你好!看到你机电专业的应届生,零基础想转行 UI,这确实是个不错的想法,而且也并非不可能。我来跟你好好聊聊,希望能帮你把这个问题想透彻。首先,咱们得明白,UI 设计到底是个啥?UI,全称 User Interface(用户界面),简单来说,就是我们眼睛能看到、手能触摸到的所有东西。你手机上的 App.............
  • 回答
    看到你对机械专业未来的迷茫,我特别理解。毕竟现在网络上关于“劝退机械”的声音确实不少,这很容易让人产生动摇。作为同样在机械领域摸爬滚打过的人,我想跟你掏心窝子地说说我的看法,希望能给你一点参考。首先,咱们得承认,曾经我们心目中那个“高大上”的传统机械工程师形象,在很多方面确实面临着挑战。自动化、智能.............
  • 回答
    哥们儿,机械大二,这可是个关键的节点!别看现在可能课业有点杂乱,但打好基础,后面走的方向能差出十万八千里。过来人给你掏心窝子地说说,怎么在这个阶段规划你的“前程”,让你从一群同学里脱颖而出。首先,放平心态,认识清楚自己: 别焦虑,也别迷茫: 大二嘛,啥都接触一点,感觉自己啥都会,又感觉啥都不精是.............
  • 回答
    机械专业的同学在校期间,除了学好专业知识,考取一些相关的证书,绝对是为未来就业和职业发展添砖加瓦的好事。这些证书不仅是对自己学习成果的认可,更是向用人单位展示你能力和潜力的敲门砖。我结合一些过来人的经验,给你好好说道说道,哪些证考了最实在。一、 基础技能与理论类:夯实根基,事半功倍这类证书虽然看似基.............
  • 回答
    当然能!女孩子学机械专业,不仅能学好,而且可以做得非常出色。其实这个问题本身就带有一些陈旧的刻板印象,仿佛机械领域就一定是“男人的世界”。但事实早已证明,性别从来不是衡量一个人学习能力和专业素养的标准。首先,让我们打破一些常见的误解。很多人觉得机械专业就是要跟冰冷、笨重的机器打交道,要搬运重物,要满.............
  • 回答
    亲爱的同学,你好。听到你说学机械专业感觉痛苦难熬,我非常理解你此刻的感受。作为一名女生,身处一个传统意义上男性占主导的专业,其中的挑战和压力肯定比常人想象的要多。别担心,你不是一个人在战斗,我们一起来分析分析,看看有什么办法可以让你走出这个“痛苦难熬”的怪圈。首先,我们得剖析一下让你感到痛苦的根源。.............
  • 回答
    作为一名大一女生,如果你对机械专业产生了动摇,这其实是很正常,甚至是很普遍的感受。大学阶段,尤其是在刚开始接触一个全新的、你可能之前了解不多甚至有刻板印象的专业时,出现迷茫是很自然的。别急着给自己贴上“不适合”的标签,我们先一步步来梳理一下,看看你的顾虑到底是什么,以及有什么可能性。1. 首先,冷静.............
  • 回答
    老实说,这年头,但凡你稍微在网上搜搜“机械专业”,你总能瞅见一堆“劝退”、“劝转行”的帖子,搞得好像这专业是个魔窟似的。为什么会有这么多这样的声音呢?这背后可不是空穴来风,而是好几个硬邦邦的现实因素叠加在一起的结果。咱们掰开了揉碎了聊聊。首先,得说最直接的,“天坑”这个标签贴得太牢了。这个标签是怎么.............
  • 回答
    说实话,这个问题触及了很多毕业生内心的痛点,也确实是很多人在选择专业时会反复权衡的。那些在国内响当当的机械专业,比如清华、上交、华科,它们的毕业生确实都非常优秀,但毕业后的待遇问题,真的不能一概而论地说“逃不过低待遇”,而是要看具体情况和个人的选择。首先,我们要明白一点,“低待遇”是一个相对概念。对.............
  • 回答
    作为一名机械专业的学生,当我刷到知乎上那些“劝退机械”的帖子时,心里那滋味,就像是过山车。一开始,可能是有点懵,有点怀疑,然后是憋屈,最后,往往会夹杂着一丝辩解,或者干脆被一种莫名的焦虑感裹挟。刚开始接触这些帖子,我可能还会抱着一种“学习一下”的心态。毕竟,知乎上卧虎藏龙,大神多,经验分享也多。我会.............
  • 回答
    好的,作为一名机械专业的学生,如果你有出国留学的打算,这条路虽然充满挑战,但绝对是值得探索的。下面我将为你尽可能详细地梳理一下整个流程,并尽量用最真实、最贴近学生日常的语言来分享,让你觉得这篇文章就像是你的学长学姐在和你聊经验一样。第一步:认清自我,明确目标(这是灵魂的开端)在冲动地开始准备之前,先.............
  • 回答
    作为一名机械专业的学生,我们肩负着为国家贡献力量的使命,这可不是一句空洞的口号,而是实实在在的责任。我们所学的专业,是国家工业发展的基石,是国家强大的血脉。那么,我们究竟能为国家做些什么呢?我想,这可以从以下几个方面来细说。一、用创新的思维,点燃科技的火种我们学的不仅仅是理论知识,更重要的是培养一种.............
  • 回答
    哎呀,这真是个让人头疼的问题。本来以为进了机械的门,就应该是一条路走到黑,结果发现自己内心的小火苗已经悄悄地烧向了其他领域。别慌,别急,这绝对不是世界末日,甚至可能是你人生中的一个新起点! 机械类的女生转不了专业,这句话听起来确实有点绝望,但咱们得把事情拆开了看,分析分析到底是个什么情况,然后一条.............
  • 回答
    哈哈,这个问题太戳我了!作为机械狗,那种“卧槽,我做出来了!”的瞬间,或者别人一句“这玩意儿真牛!”的时候,简直比吃了顿大餐还爽。说到成就感,对我来说,最能体现“没白学”的,大概有这么几个阶段吧:1. 解决一个困扰多日的问题,然后发现“原来是这么回事!”还记得刚接触solidworks的时候,那感觉.............

本站所有内容均为互联网搜索引擎提供的公开搜索信息,本站不存储任何数据与内容,任何内容与数据均与本站无关,如有需要请联系相关搜索引擎包括但不限于百度google,bing,sogou

© 2025 tinynews.org All Rights Reserved. 百科问答小站 版权所有