问题

如何系统学习机器学习?

回答
想要真正掌握机器学习,不是走马观花地看几个教程,也不是死记硬背几个算法公式,而是一个循序渐进、融会贯通的过程。你可以把这个过程想象成学习一门新的语言,或者掌握一项精湛的手艺。

首先,你得建立起一个坚实的基础。这就像是学习任何一门语言,你需要先掌握它的基本词汇和语法。对于机器学习来说,这些基础知识包括:

数学基石: 线性代数是必不可少的。你需要理解向量、矩阵的概念,知道如何进行矩阵运算,了解特征值和特征向量的意义。这就像是理解语言的词语是如何组合成有意义的句子一样,线性代数帮助你理解数据是如何表示和操作的。微积分同样重要,特别是导数和梯度,它们是理解优化算法如何工作的关键。如果你对概率论和统计学有一定了解,那就更好了,因为机器学习很大程度上是在处理不确定性和数据中的模式。
编程技能: Python无疑是当前机器学习领域最流行的语言,它的易学易用以及丰富的库(如NumPy, Pandas, Scikitlearn)让你事半功倍。你需要熟练掌握Python的基本语法,了解如何使用这些数据科学库来处理数据、实现算法。就像学习写字一样,掌握了工具,才能开始创作。

打好了基础,你就可以开始接触机器学习的核心概念了。这部分就像是学习语言的句式和表达方式。

理解机器学习的类型: 你需要明白机器学习是如何被划分的。最常见的分类是监督学习、无监督学习和强化学习。监督学习就像老师教学生,给的数据带有明确的“答案”,你需要根据这些信息来预测未知。无监督学习则像是让学生自己去探索,没有明确的指示,只能自己发现数据中的规律和结构。强化学习则是一种通过试错来学习的行为,就像训练宠物,好的行为得到奖励,坏的行为受到惩罚。
学习核心算法: 在理解了不同类型的学习后,就可以深入学习具体的算法了。从简单的线性回归、逻辑回归开始,它们是理解更复杂模型的基础。然后是决策树、支持向量机(SVM),这些算法在很多实际问题中都有广泛应用。你还需要了解集成学习方法,比如随机森林和梯度提升,它们通常能带来更好的性能。还有神经网络,这是深度学习的基础,理解其基本结构和工作原理至关重要。学习这些算法,不仅要记住它们的名字,更要理解它们背后的思想、适用的场景以及优缺点。
模型评估与调优: 学习了算法,你还得学会如何判断一个模型好不好,以及如何让它变得更好。这涉及到理解各种评估指标,比如准确率、召回率、F1分数、AUC等,并知道在不同场景下应该侧重哪些指标。同时,你还需要学习如何避免过拟合(模型在训练数据上表现很好,但在新数据上表现差)和欠拟合(模型连训练数据都未能很好地拟合),这通常通过交叉验证、正则化等技术来实现。

掌握了基础算法和评估方法后,就可以进入更高级和实际的应用阶段了。这就像是开始用语言进行创作,写诗、写故事。

深入理解神经网络和深度学习: 如果你对计算机视觉、自然语言处理等领域感兴趣,深度学习是绕不开的。你需要深入学习不同类型的神经网络,比如卷积神经网络(CNN)用于图像处理,循环神经网络(RNN)和Transformer用于序列数据处理(如文本)。理解反向传播算法、激活函数、损失函数、优化器(如Adam、SGD)的工作原理至关重要。
实际项目经验: 理论学得再好,不如亲手实践。找到一些真实的数据集,尝试将学到的算法应用到实际问题中。你可以从Kaggle这样的平台获取大量比赛数据和代码,学习别人的解决方案,然后自己动手实现。从数据预处理、特征工程,到模型选择、训练、评估,每一步都需要你思考和实践。
持续学习与探索: 机器学习领域发展迅速,新的算法和技术层出不穷。你需要保持好奇心,关注最新的研究进展,阅读论文,参加相关的线上课程或研讨会。理解一些更复杂的概念,比如贝叶斯方法、无监督特征学习、迁移学习等,可以让你在解决问题时有更多的工具和思路。

整个过程不是线性的,你可能在学习一个算法时,需要回头巩固数学知识;在实践一个项目时,又会遇到新的算法需要去学习。最重要的是保持耐心和坚持,享受这个不断学习和解决问题的过程。把它当作一场智力探险,你会发现其中的乐趣远不止于掌握一门技术。

网友意见

user avatar

想要成为一名人工智能从业者?系统学习机器学习是重点!

机器学习是一门不需要进行明确编程就能使计算机发挥作用的科学。在过去的十年里,机器学习已经为我们提供了自动驾驶汽车、实时语音识别、高效网络搜索等实用工具,并帮助我们极大地提升了对人类基因组的认知。许多研究人员都认为发展机器学习是向人类水平的人工智能迈进的最好方式。

这里向大家提供三个系统学习机器学习的步骤:学习基础编码知识、学习机器学习及深度学习、专注于一个角色。

想要成功构建机器学习系统,基本的编程技能是先决条件。在开始实践简单的机器学习算法之前,你需要具备编写一个简单的计算机程序(函数调用,for loops,条件语句,基本的数学操作)的能力。虽然掌握更多数学知识能让你更具优势,但也不必将精力过多投入到诸如线性代数、概率和统计这样的数学基础上。

在学习了基础编码知识后,就可以正式开始你的机器学习之旅了。由斯坦福大学推出的“机器学习课程”是你不错的选择。该课程提供了对机器学习、数据挖掘和统计模式识别的广泛介绍,能帮助大家有效构建对机器学习的认知和理解。主要内容包括:监督学习、无监督学习和机器学习的最佳实践。

该课程从大量的案例研究和应用中汲取经验,便于大家学习如何将学习算法应用于构建智能机器人(感知、控制)、文本理解(网络搜索、反垃圾邮件)、计算机视觉等任务。

此外,深度学习也是你需要涉猎的领域。由DeepLearning.AI开发的“深度学习专业课程”涵盖了你在计算机视觉、自然语言处理和语音识别等领域构建应用程序所需的知识。你将从医疗保健、自动驾驶、手语阅读、音乐生成和自然语言处理等方面开展案例研究,以便于在掌握理论知识的基础上了解深度学习在各行业中的实际应用。

当你对机器学习和深度学习都有了较为深入的学习后,下一步行动将取决于你心中想要成为的角色,例如成为数据科学家、机器学习工程师或机器学习研究员等,亦或是将所学的AI技能与你目前从事的工作相结合,将人工智能更好地应用于现实世界问题。

确定角色之后就要迈入真正的实践环节了。对此,项目选择和团队合作至关重要。确定可行和有价值的项目是一个重要的步骤,必须在你的职业生涯中反复实践。在完成项目的过程中,团队合作比单打独斗更容易取得成功。与他人合作、提供及听取建议的能力至关重要,这能帮助你在协作过程中建立广泛的关系网。当你需要帮助或建议的时候,拥有一个强大的职业关系网能够助你前行。

在积累了一定的机器学习理论知识和实践经验后,找到一份相关的工作看似是每个人的最终目标,但它只是漫长职业生涯中的一小步。你需要保持自律,不断学习。身边的人并不清楚你把周末的时间是用在学习还是刷手机上了,但随着时间的推移,他们终将注意到差异。自律的生活可以帮助你在保持健康的同时继续进步。

希望上述建议能为你打开机器学习的大门,从初学者一路走向从业者。这条路注定是宽阔却不平坦的,但这一路上遇到的人和事都将助你走向成功。

我的深度学习相关课程也将在近期登录知乎,敬请关注,我们下次再见!

请继续学习!

吴恩达

user avatar

我5年前写过一篇机器学习入门的文章,目前为止,获得了4700+赞和2.1万的收藏

不过5年过去了,这个学习机器学习的路线有点过时了。这篇问答就作为这个文章的更新版吧。

小猫咪和你学习Machine Learning

前置知识及技能

1、英语。起码能基本的听和读吧,感觉中文的资料还不够多,很难避免要看很多英文资料。建议学习某些教程时看英文版的tutorial,YouTube可以开字幕。最重要的是,当你学习机器学习深入了,要看论文了,就没有中文资料可以看了。

2、线性代数基础,如果没的话,还是先学了这门课在研究吧,不然会哭的。一般理工专业大一会学,如果真的没学过,可以看看帝国理工学院的教程《Mathematics for Machine Learning: Linear Algebra》。这里也不是说要你线代考到100分才适合开始学机器学习,其实你会行列式计算之类的基本就够了。

3、编程语言:学会python就行了。R也可以用用。不过编程语言这种东西,自学还是挺困难的,如果真的要自学,可以找些伙伴一起互相鼓励。


入门课程:

1. Machine learning by Andrew Ng(吴恩达)

我最早是看 @吴恩达 老师在coursera上的课程入门的。截止我写本回答为止,这门课程已经有580万人学过了。(机器学习行业,卷起来了!)

这门课安排了11周的学习内容,如果你有余力,可以加快进度,但不要跳过练习题,练习题非常有价值,虽然并非用Python写的(而是matlab/octave)。如果你不想学matlab,想跳过,那么你最好找点别的用Python的习题练练手。而且最好直接按顺序一课课学,不要着急。在学完这个课程前,不要学后面的。

2.CS231n: Convolutional Neural Networks for Visual Recognition

Stanford最受欢迎的课之一。就算你不想搞图像识别,也会学到很多有用的通用的东西。尽管这么多年过去了,这门课还是很有价值。


3. 《机器学习》——周志华

前面都是视频。如果说要一本书作为参考,则最受欢迎的是周志华的《机器学习》,人称西瓜书

不过这本书作为入门确实会很难,书中含有大量的公式。建议和 @Datawhale 的南瓜书一起看

这本书虽然是开源的,但也是有实体书的。


框架研究

如果你看我五年前写的文章,我推荐的框架第一个是TensorFlow。不过到2022年了,我更推荐PyTorch(这个框架我五年前甚至还没推荐过),其次才是Tensorflow。PyTorch在易用性方面比TensorFlow好很多。在Paperswithcode上显示,过去6年,越来越多的论文选择用PyTorch作为实现框架,用TensorFlow的是越来越少了。其实只学PyTorch,也足够找工作或者做研究了。

图源:https://paperswithcode.com/trends

在研究框架前,请确认你拥有了基础的机器学习知识,至少系统学完一门机器学习的课程,不然你很难弄懂框架在说啥。

训练实战

kaggleYour Home for Data Science

如果你是新手,我建议把Titanic项目玩一次:Titanic - Machine Learning from Disaster

阿里云天池天池大数据众智平台-数据科学家社区

关于比赛的书,推荐《机器学习算法竞赛实战》,作者是王贺,也在知乎 @鱼遇雨欲语与余



知乎上值得关注的AI领域答主

说实话,知乎有很多作者,他们写了很多很有见地的回答,这些回答既有硬核的,也有入门的,虽然说看看论文和视频也能让你入门,但看看这些知乎答主的回答,你会对AI领域的理解更深。这里推荐一些我有关注的答主,也欢迎在评论区补充(自荐也行)。

  • @吴恩达 (刚入驻知乎,据说后续会发很多教学视频)
  • @李沐 (机器学习大神,出了很多教学视频)
  • @微调 (俺的调宝:异常检测方向的大神,大名鼎鼎PyOD库的作者,github排名前1000)
  • @白小鱼 (机器学习、人工智能领域优秀答主)
  • @lokinko (联邦学习方向的研究生)
  • @Serendipity (网络空间安全的博士生,在AI领域也有很多不错的回答)
  • @夕小瑶 (画风很萌的机器学习优秀答主)
  • @王喆 (广告/推荐领域的专家)
  • @Datawhale (贡献了很多开源教程,Datawhale的公众号更是精华)
  • @陈然 (数据挖掘、机器学习、人工智能话题优秀答主)
  • @zibuyu9 ( 清华大学计算机系自然语言处理实验室副教授刘知远)
  • @马东什么 (PayPal数据科学家)
  • @陀飞轮 (阿里巴巴高级算法工程师)
  • @Houye (文章很多干货)
  • @平凡 (数据分析、人工智能方面也有不少回答)


更多参考资料

类似的话题

  • 回答
    想要真正掌握机器学习,不是走马观花地看几个教程,也不是死记硬背几个算法公式,而是一个循序渐进、融会贯通的过程。你可以把这个过程想象成学习一门新的语言,或者掌握一项精湛的手艺。首先,你得建立起一个坚实的基础。这就像是学习任何一门语言,你需要先掌握它的基本词汇和语法。对于机器学习来说,这些基础知识包括:.............
  • 回答
    好的,咱们不聊那些虚头巴脑的AI,就好好说说,怎么把移动平均线这玩意儿给啃明白了。这东西看着简单,但里面门道不少,想真正用好,得花点心思。首先,咱们得明白“移动平均线”是个啥玩意儿简单说,它就是个“平均数”,但不是一次算完就扔那儿的。它是“移动”的,也就是说,每过一天(或者一个你设定的周期),就去掉.............
  • 回答
    FAHP与TOPSIS系统学习指南:从原理到实践的深入探索在决策科学的浩瀚领域中,多准则决策分析(MCDA)扮演着至关重要的角色,帮助我们在面对复杂且相互关联的选项时,能够做出更理性、更优化的选择。而层次分析法(AHP)及其扩展——模糊层次分析法(FAHP),以及优劣解距离法(TOPSIS),则是M.............
  • 回答
    十四岁,能领悟到数字和公式中蕴含的美,这真是一件令人兴奋的事情。这份热爱是探索物理世界的绝佳起点,它不像是在应付功课,更像是在揭开宇宙的神秘面纱,而你手中的钥匙就是那些看似抽象的物理定律和数学工具。要系统地学习物理问题,我认为最重要的一点是理解,而不是死记硬背。物理不是一套僵化的规则,而是描述我们所.............
  • 回答
    想要系统地学习汽车设计,这绝对不是一蹴而就的事情,更像是踏上一条充满挑战但也极其诱人的旅程。它需要的不仅是兴趣,更是一套严谨的、多维度的知识体系和实践技能。咱们就从头到尾,把这件事情掰开了揉碎了聊聊。第一步:打下坚实的基础——理解“为什么”和“是什么”在开始“怎么画”之前,我们得先明白汽车是干什么用.............
  • 回答
    好的,咱们来聊聊怎么系统地学习三角铁,把这件乐器玩转。别担心,这不像你想象的那么难,而且过程会很有趣。我会尽量把细节都跟你说清楚,让你听起来就像是跟你多年的乐器老师在聊天一样。一、 了解你的新朋友——三角铁(Triangle)首先,得跟这小家伙混个脸熟。三角铁看着简单,但它可是很有讲究的。 它长.............
  • 回答
    想要系统地学习行为经济学,绝非一日之功,这更像是一场探索人类决策奥秘的旅程。它不像学习一门严谨的数学公式那样,有着明确的起点和终点,而是需要你带着好奇心,一层一层剥开人们行为背后的心理驱动力。下面,我将为你梳理一条相对清晰的学习路径,希望能帮助你扎实地走好每一步。第一步:建立基础的经济学认知(这块别.............
  • 回答
    从零开始,解锁VHDL的数字设计世界想象一下,你手里握着一块空白的电路板,脑海中构思着一个精巧的逻辑功能。现在,你不再需要用实体导线去拼凑,而是可以通过一种强大的语言——VHDL——将你的设计思路具象化,并最终在硬件中实现。这听起来很酷,对吧?VHDL,也就是VHSIC硬件描述语言(VHSIC: V.............
  • 回答
    好的,咱们来聊聊怎么扎实地学好网络安全这门学问。这不是一蹴而就的事儿,得一步一个脚印,有条理地来。我尽量把我的理解跟你分享清楚,让你觉得这是个人经验之谈,而不是冷冰冰的机器输出。第一步:打好基础——你得会“说人话”网络安全不是凭空出现的,它建立在一堆基础学科之上。如果你连这些基础都没沾过,那学起来会.............
  • 回答
    好的,我们来聊聊怎么把吉他乐理这事儿,一个字一个字地给它捋清楚,让你这个新手能扎扎实实地站稳脚跟。别想着一口吃个胖子,咱们一步一步来,就像弹奏一首好听的曲子,有起承转合,有节奏变化。第一步:你得知道“音乐”是个啥玩意儿——最基础的概念这就像你刚拿手机,得先知道怎么开机关机,怎么滑动屏幕一样。 声.............
  • 回答
    作为一名计算机专业的学生,想要系统地掌握前端技术,你需要构建一个扎实的基础,并循序渐进地深入学习。这不仅仅是学会几个框架,而是理解背后的原理和生态系统。下面我为你梳理一个详细的学习路径,希望能帮助你理清思路,高效成长。第一阶段:夯实基础(这是重中之重,别跳过!)这个阶段的目标是让你能够理解网页是如何.............
  • 回答
    作为在校大学生,想要系统地学习产品经理相关知识,这绝对是一个明智的选择。这个行业发展迅速,而且非常有前景。别想着一蹴而就,系统性学习是关键,就像盖房子,地基打得牢,楼才能盖得高。下面我就给你掰扯掰扯,怎么把这事儿办得明明白白。首先,咱们得明白,产品经理不是一个单一技能的职位,它更像是一个“万金油”,.............
  • 回答
    想深入了解并熟练运用一个开源框架,这可不是光靠看几篇入门教程就能一蹴而就的事情,它更像是一场细致的探索和实战的磨练。首先,咱们得明确目标。你之所以想学这个框架,是因为它能解决你当前面临的某个问题?还是因为它在行业内非常流行,掌握了它能让你更具竞争力?明确了这一点,你就能更有针对性地去学习,知道哪些部.............
  • 回答
    当一个军事爱好者,想要系统有效地学习战争史,尤其是第一次世界大战、第二次世界大战以及现代局部战争,这就像是在为自己的军事知识库搭建一座坚实的、多层次的结构。这可不是随随便便翻翻资料就能达到的境界,而是需要方法、耐心和持续的投入。今天,咱们就来聊聊怎么把这件事儿做得漂亮。第一步:打好基础,建立框架——.............
  • 回答
    人生海海,能静下心来学习一项新技能,本身就是一件值得庆幸的事。尤其是在信息爆炸的时代,我们总觉得时间不够用,想要掌握点什么,却又被无数的“看起来很棒”的东西牵着鼻子走。LaTeX,这门排版界的“老炮”,很多人听过,但真正花时间去啃它的,可能就不多了。今天,咱们就来聊聊,如何在有限的时间里,把LaTe.............
  • 回答
    好的,让我们来聊聊如何系统地学习莫扎特的钢琴作品。这可不是一件简单的事儿,因为莫扎特的音乐看似轻盈如羽毛,实则蕴含着极为精妙的结构、丰富的和声和深刻的情感。想要真正奏响莫扎特的“味道”,需要耐心、细致和一颗真正热爱音乐的心。 第一步:打下坚实的基础——技术是灵魂的载体莫扎特的钢琴作品对演奏者的基本功.............
  • 回答
    脱离“随波逐流”:打造你的专属学习引擎我们每个人都是独一无二的,学习这件事,更是如此。与其在海量信息中迷失方向,被动接受,不如构建一个以自己为核心的学习系统,找到属于自己的节奏,让学习真正成为一件主动且高效的事情。这并非什么神秘的技巧,而是通过几个关键环节的精细打磨,让你的学习之路变得清晰而有力。 .............
  • 回答
    评析TensorFlow 2.0:从“够用”到“好用”的进化之路Google在2019年年底正式发布了TensorFlow 2.0,这标志着这个曾经备受推崇但也在一定程度上饱受诟病的深度学习框架,迈入了全新的时代。相较于其前身,TensorFlow 2.0的发布绝非一次简单的版本迭代,而是一场深刻的.............
  • 回答
    陈天奇的NNVM(Neural Network Value Model)系统,可以说是在深度学习编译领域一次非常大胆且具有深远影响的尝试。它不单单是一个新的框架,更是一种对深度学习模型表示和优化方式的全新思考。要评价它,咱们得从几个关键角度深入剖析。核心理念的突破:模型即计算图,计算图即程序NNVM.............
  • 回答
    构建你的专属学习笔记系统:从零到精通在信息爆炸的时代,如何有效地吸收、整理和回顾知识,是每个开发者都需要面对的挑战。传统的纸质笔记,虽然有其情怀,但在检索、关联和分享等方面已显不足。因此,建立一个属于自己的、高效的学习笔记系统,变得至关重要。这不仅仅是记录代码片段,更是构建个人知识体系、加速技术成长.............

本站所有内容均为互联网搜索引擎提供的公开搜索信息,本站不存储任何数据与内容,任何内容与数据均与本站无关,如有需要请联系相关搜索引擎包括但不限于百度google,bing,sogou

© 2025 tinynews.org All Rights Reserved. 百科问答小站 版权所有