问题

马上计算机研一,想问一下机器学习、深度学习…大家都是怎么入门的?

回答
计算机研一,刚开始接触机器学习和深度学习,这确实是很多同学都会经历的一个阶段。想当年我刚入学的时候,也像你一样,心里充满了好奇和一丝丝的迷茫,不知道从何下手。后来在老师、师兄师姐以及各种学习资源中摸索,慢慢找到了自己的节奏。下面我就把我的入门经历和一些体会,尽量详细地跟你聊聊,希望能给你一些启发。

首先,别把机器学习和深度学习想象得太过神秘。它们其实都是一门科学,有其内在的逻辑和方法。刚开始,很多人都会被各种复杂的算法名称和数学公式吓到,比如线、支持向量机、神经网络、反向传播……感觉自己是不是得先成为数学大神才能学?其实不然。

我的入门,更多的是从“理解概念”开始的,而不是一开始就钻研那些高深的数学证明。你可以把机器学习想象成教计算机“学习”人类的经验,然后让它自己去做判断或者预测。比如,你教小孩子认猫和狗,给他看很多猫的照片,告诉他这是猫;再看很多狗的照片,告诉他这是狗。看得多了,他就能自己区分了。机器学习也是类似,我们给计算机看大量的“数据”,并告诉它这些数据对应的“结果”,然后让它找出数据和结果之间的规律。

那么,具体怎么开始呢?

第一步,建立一个大概的框架和方向。
别一开始就想把所有算法都学一遍。机器学习是一个很大的领域,里面有很多分支。你可以先了解一下机器学习的几个主要方向:监督学习(就像我刚才说的教小孩子认猫狗,有明确的标签)、无监督学习(给一堆东西,让它自己找出相似的类别)、强化学习(让计算机通过试错来学习,比如玩游戏)。深度学习则是机器学习中的一个分支,它特别擅长处理复杂的数据,比如图像、语音、文本,因为它使用了“深度”的神经网络模型。

我当时是怎么做的呢?我找到了一些介绍机器学习和深度学习的“导论”性质的课程或者博客文章。这些内容通常不会讲太多复杂的数学,而是侧重于解释“是什么”、“为什么”以及“能做什么”。它们会用一些生动的例子,比如识别手写数字、推荐商品、人脸识别等等,来让你对这个领域有一个直观的感受。不用怕看不懂一些细节,关键是建立起一个整体的概念,知道这个领域大致是做什么的,有哪些重要的技术。 想象一下,你第一次接触一个新城市,你先要知道这个城市大概有哪些区域,哪里是商业区,哪里是住宅区,而不是一开始就去研究每一条街道的走向。

第二步,动手实践,从基础的库开始。
光看不练是学不会的。就像学游泳,你不可能光看教程就学会。所以,从概念理解后,下一步就是上手代码。对于机器学习,Python是目前最主流的语言,它的生态系统非常完善。你需要学习一些基础的Python语法,但别想着把Python学得像大神一样,够用就行。

然后,你会接触到一些非常重要的库。NumPy 是用来处理数值计算的,它是很多其他科学计算库的基础,你可以理解它就像给Python安装了一个强大的数学计算引擎。Pandas 则是用来处理和分析数据的,就像一个万能的数据表格工具,可以方便地读取、清洗、整理你的数据。Matplotlib 和 Seaborn 是用来做数据可视化的,让你的数据“说话”,通过图表来理解数据,这非常有帮助。

掌握了这些基础库之后,你就可以开始接触机器学习的“入门级”算法库了,最最经典的就是 Scikitlearn。这个库把很多常用的机器学习算法都封装好了,你只需要调用几行代码,就能实现一个模型。比如,你可以用它来训练一个识别手写数字的模型,或者预测房价。这个过程会让你体会到,原来机器学习是可以这么“落地”的。 别被网上的教程里那些复杂的代码吓到,很多时候,用Scikitlearn实现一个基本模型,比你想象的要简单得多。

第三步,循序渐进地学习算法和数学。
当你有了一些实践的经验,对整个流程有了一些感觉之后,你就可以开始深入学习具体的算法了。这时候,你需要一点点地去理解背后的数学原理。

比如说,你用Scikitlearn实现了一个线性回归模型,那么你就可以去了解一下“线性回归”到底是怎么回事?它为什么能拟合数据?这时候,你就需要接触一些基础的数学知识,比如:

线性代数:矩阵、向量、行列式等等,这些是理解很多算法的基础,尤其是在处理高维数据和深度学习时。
微积分:梯度下降,这是很多优化算法的核心,用来找到模型的“最佳参数”。
概率论与统计学:理解数据分布、模型评估等等。

我的学习方法是,当我对某个算法产生了好奇,或者在实践中遇到了瓶颈时,我才会去专门学习相关的数学知识。 比如,我学到支持向量机(SVM)的时候,发现它用到了“核函数”的概念,我就去查SVM的原理,然后了解了“核技巧”是怎么回事,这就需要用到一点点线性代数和微积分的概念。关键是,让数学服务于你的学习目标,而不是为了学数学而学数学。

关于深度学习,它更像是在机器学习的基础上,引入了“神经网络”的概念。 神经网络,你可以把它想象成一层一层的信息处理单元,每一层都在对输入的数据进行某种转换,最终输出结果。深度学习就是拥有很多很多层的神经网络。

要入门深度学习,你需要学习相关的框架,最流行的就是 TensorFlow 和 PyTorch。这两个框架提供了强大的工具,让你能够方便地构建、训练和部署神经网络模型。我个人当时是选择了PyTorch,因为它在学术界和研究领域非常受欢迎,上手也相对直观一些。

学习深度学习的实践过程,大概是这样的:
1. 理解神经网络的基本结构:比如全连接层、卷积层(CNN,常用于图像)、循环层(RNN,常用于序列数据)等。
2. 学习反向传播算法:这是训练神经网络的核心,简单来说,就是通过计算误差,然后一层层地往回调整每一层的参数,让模型越来越准。
3. 动手实现简单的神经网络:比如用PyTorch实现一个识别MNIST手写数字的CNN模型。这个过程会让你非常清晰地看到,从数据输入到模型输出,中间发生了什么。
4. 学习更复杂的模型和技术:比如残差网络(ResNet)、Transformer、注意力机制等等。这些是当前深度学习领域的热点,也是让你模型效果更上一层楼的关键。

最后,分享几个我学习过程中比较重要的体会:

不要害怕犯错和“调参”:机器学习和深度学习的模型,很多时候都需要根据数据和任务去调整参数,找到最适合的设置。这个过程就像是在“调校”一个精密的仪器,需要耐心和尝试。
多看别人的代码和项目:GitHub 上有无数优秀的开源项目。学习别人的代码,理解他们是怎么解决问题的,是一种非常高效的学习方式。你可以从一些经典的小项目开始,比如图像分类、文本生成等。
加入学习社区:学校里、网上都有很多机器学习和深度学习的社群。和同学们一起讨论,和师兄师姐交流,可以让你少走很多弯路,也能从不同的视角获得启发。
保持好奇心和探索欲:这个领域发展得非常快,新技术层出不穷。关键是保持学习的热情,去探索那些你感兴趣的方向。

总而言之,入门机器学习和深度学习,就像是在建造一座房子。你需要先有一个大致的蓝图(理解概念),然后打好地基(学习基础库),再一块块地砌墙、盖顶(学习算法和框架),最后再进行装修和细节调整(优化模型和研究前沿)。

希望我的这些经验分享能对你有所帮助。作为研一的同学,有足够的时间和精力去探索,这是最好的阶段。慢慢来,享受这个学习的过程,你会发现其中的乐趣和成就感。祝你学习顺利!

网友意见

user avatar

机器学习入门真的好难,我也经常被问到这个问题,但是我并没有特别好的回答。

对于新手而言,有四座大山:数学基础算法模型机器学习应用、常见工具。市面上常见教材都主要关注算法模型,而很难兼顾另外几个方面,所以学习的过程中最常见的问题就是这公式是咋推的?我学这个有啥用?模型懂了咋实现?

一本教材解决不了所有问题,机器学习的学习过程是个螺旋上升的过程。先学习一些算法模型,看不懂了再去学一些数学,同时也要看看常见的应用比如推荐、搜索、NLP、CV中是如何运用的,跑一跑最新的库。再回来学一些模型,看一看数学。螺旋上升,慢慢提高。

分享一下我的学习过程,也是缓慢的。

本科的时候机器学习还没有兴起,大家主要还在讨论数据挖掘。我在实验室里也跟着看了些论文,了解了一些最基本的规则抽取、Topic Model。这个时候学的很不系统,但是激发了兴趣。

去 CMU 研究生阶段主要的选课就以机器学习为主了。机器学习的几个方面:模型、数学、应用、工具我都选了一些课程。

  • 10601 Machine Learning:入门课程,系统性地接触了机器学习中的各种模型和算法。感觉学的也有些迷迷糊糊,每天还都想着那些问题,这玩意咋推的?这玩意有啥用?这玩意咋实现?
  • 10805 Deep Learning:那个时候深度学习还没有兴起,这个课还是个小课,只有一二十个人上(听说现在已经爆炸了)。以读论文和小组讨论为主,我感觉也学的比较迷糊,只是把一些关键词和直觉留了个印象。
  • 11641 Search Engine & Web Mining:这个课程就是以应用为主了,在明确需求的情况下再思考模型和算法都有些什么用,确实打通了一些之前的困惑。感觉学应用还是快乐一些,作业中就有刷 leaderboard,各种黑科技刷的不亦乐乎。
  • 15619 Cloud Computing:学校给钱用 AWS,学习了很多如何使用云工具,收获很大。
  • 11791 Software Engineering for Information Systems:再学习了一遍软件工程。

第一学期选课太多,有点爆炸, 第二学期就少选了很多。

  • 10605 Machine Learning in Large Dataset:主要学习如何用 Hadoop 实现贝叶斯算法,了解了分布式系统中一些不一样的问题,对于当时特别火热的 Large Scale Machine Learning 和 Parameter Server 有了更感性的认知。
  • 10708 Probabilistic Graphical Models:当时最火的概率图模型,Eric Xing 教授讲的太快了,看了很多论文,学的也有些一知半解。
  • 11792 Software Engineering for Information Systems:第二学期开始跟着实验室做一个 AI for Law 的项目,这个项目暑期和第三学期也在做,最后发表了论文。这个偏应用的项目接触到了一些 NLP,把之前学习的东西又都串了一串增加了感悟。

第三学期主要就是做AI for Law的那个毕业项目了。

  • 10705 Intermedia Statistics:统计系开的课,说是中级统计,但其实主要是从统计的角度讲机器学习,数学又巩固了一些,把之前学过的东西又学了一遍。

当然这只是入门,工作之后又有了很多新的理解,要学习的东西感觉更多了。

总体来说我的入门也是常常一脸懵逼,经常卡住,反复从多方面学习,模型不懂了就去看看应用,写写代码跑一跑,再回去看看数学,再去看看模型,这就是个螺旋上升的过程,做打持久战的准备。苟...苟日新,日日新,又日新。

类似的话题

  • 回答
    计算机研一,刚开始接触机器学习和深度学习,这确实是很多同学都会经历的一个阶段。想当年我刚入学的时候,也像你一样,心里充满了好奇和一丝丝的迷茫,不知道从何下手。后来在老师、师兄师姐以及各种学习资源中摸索,慢慢找到了自己的节奏。下面我就把我的入门经历和一些体会,尽量详细地跟你聊聊,希望能给你一些启发。首.............
  • 回答
    马云口中的“新三驾马车”——AI技术、芯片制造、云计算——无疑是阿里巴巴向未来转型、重塑自身核心竞争力的战略重心。这三大领域都指向了更底层、更具赋能潜力的技术基石,是未来数字经济的“水电煤”。那么,阿里巴巴是否会因此“放弃”天猫好房这样的业务呢?我认为,答案并非简单的“是”或“否”,而是取决于阿里巴.............
  • 回答
    你这个问题问到点子上了,确实,在一些场合,我们经常能听到关于中国GDP“水分大”的说法,尤其是“拆了建、建了拆也算GDP”这种例子,更是让人产生很多疑问。这背后牵扯到GDP的计算方式以及经济活动的本质。咱们就来好好捋一捋,把GDP到底是怎么算的,以及为什么会有这种误解讲明白。 到底什么是GDP?首先.............
  • 回答
    Operation Zipper:一场风险与回报并存的战役规划二战末期,当欧洲战场硝烟渐散,盟军的目光便转向了远东。在东南亚,日军的势力范围依旧庞大,其中,作为马亚半岛腹地的战略重镇,新加坡(当时被称为“新马”,意为新的马来亚)的地位不言而喻。英军基于收复这片失地的战略考量,制定了一系列名为“Ope.............
  • 回答
    马哈蒂尔总理宣布取消马新高铁计划,这无疑是马来西亚近期政治和经济领域的一件大事,也对区域互联互通格局产生了深远影响。作为一位经验丰富且充满争议的政治家,马哈蒂尔的这一决定并非一时冲动,背后有着复杂的考量。要理解这一举措,我们需要从多个维度深入剖析。首先,我们必须谈谈取消计划最直接的原因——成本。马新.............
  • 回答
    马云卸任阿里巴巴董事局主席职务,这是中国互联网巨头阿里巴巴历史上的一个重要节点。看待这一事件,我们可以从多个维度进行分析,并探讨阿里巴巴的传承计划将如何展开。 如何看待马云不再担任阿里巴巴董事局主席职务:这是一个复杂而多层次的事件,我们可以从以下几个角度来理解:1. 时代印记与企业发展阶段的自然过.............
  • 回答
    马云曾于2016年底提出,阿里巴巴将帮助100万美国中小企业在未来五年内通过阿里巴巴平台向中国及亚洲其他地区销售产品,从而创造100万个美国就业机会。当时正值美国总统大选刚结束不久,唐纳德·特朗普当选总统,他一直强调“美国优先”和制造业回流。计划的初期设想与背景这个计划在当时引起了广泛关注,原因有几.............
  • 回答
    威马的未来:靠谱还是概念?一份审慎的审视近来,新能源汽车市场风起云涌,各家车企纷纷亮出杀手锏,描绘着未来出行的蓝图。在这场激烈的角逐中,威马汽车,这个曾经一度被寄予厚望的造车新势力,其未来产品计划也再次成为公众关注的焦点。然而,在光鲜亮丽的PPT背后,我们看到的究竟是实实在在的靠谱落地,还是仅仅停留.............
  • 回答
    马上就要三十岁,身边的朋友因为年龄焦虑失眠,这是一种非常普遍的现象,尤其是在现代社会。三十岁是一个人生重要的转折点,很多人在这个年龄会回顾过去,展望未来,从而产生各种各样的情绪和压力。年龄焦虑和失眠往往是相辅相成的。如何调整心态改善睡眠,这是一个需要系统性思考和实践的过程。以下是一些详细的建议,希望.............
  • 回答
    好的,距离2022年已经不远了,在这个时间点,微单相机市场百花齐放,涌现出许多非常优秀的产品。选择“最值得入手”的相机很大程度上取决于你的预算、拍摄需求(人像、风光、视频、运动、街拍等)以及你对品牌的偏好。不过,我可以为你梳理一下目前市场上(截至2021年底)最受欢迎、最具代表性的微单相机,并从不同.............
  • 回答
    收到!马上要订婚结婚了,这可是人生大事,肯定要仔细斟酌。你这心里头犯嘀咕“人还能不如车”我特别能理解。咱们一点点来捋捋。首先,你提的彩礼加定金共16万,这数字本身从高低上说,没有一个绝对的“过分”或“不过分”的标准。它跟很多现实因素挂钩,最直接的就是你家那边的风俗习惯,还有你跟你未婚夫之间的感情基础.............
  • 回答
    马上就要结婚了,我脑子里现在是一团乱麻,感觉天都要塌下来了。事情是这样的,我男朋友,我以为我了解他的一切,包括他的家庭。我们在一起两年了,他时不时会提起他的父母,说他们住在另一个城市,是个小康家庭,过得很安稳。他跟我描述过他家里的装修风格,他父母平时的生活习惯,甚至还说过他小时候的一些趣事。我一直觉.............
  • 回答
    见女朋友家长是恋爱关系中非常重要的一步,既是对双方家庭的尊重,也是对未来关系的考验。以下从多个方面详细列出注意事项,帮助你以得体、真诚的态度面对这次见面: 一、见面前的准备1. 了解家庭背景 提前了解女方父母的年龄、职业、教育背景、家庭经济状况(避免敏感话题,如收入、婚姻状况)。 .............
  • 回答
    即将失明,这是一种极度复杂、深刻且不断变化的体验,它影响着一个人生活的方方面面,触及最深层的情感、心理和生存需求。这种体验并非单一的,而是随着时间推移、失明的原因以及个体应对方式的不同而呈现出不同的面貌。我可以尝试从以下几个维度,尽量详细地描绘这种体验:1. 感官世界的转变与失落: 视觉信息的渐.............
  • 回答
    听到你要面临这样的境况,心里一定非常复杂。虽然我不能完全体会你现在的感受,但我可以试着从一些你可能需要考虑和准备的角度,给你一些建议。记住,这些只是普遍性的提示,具体情况可能因你所处的环境和司法体系而有所不同。心理准备: 接受现实,但不要放弃希望: 这可能是最难的一步。坐牢意味着你的生活会发生巨.............
  • 回答
    恭喜您即将踏上波音737800改装的征程!这绝对是一件令人兴奋且富有挑战性的事情。作为一款在全球范围内广泛应用的机型,737800拥有成熟的技术基础,但改装工作依然需要细致的规划、专业的知识和对细节的严谨把控。为了帮助您更好地准备,我将从学习资料和注意事项两个方面,尽可能详尽地为您梳理一番。 一、 .............
  • 回答
    哈哈,说到世代交替,真是让人感慨万千啊!想想当年 PS2 变 PS3,然后 PS3 到 PS4,再到现在的 PS5,时间过得真是嗖嗖的。每个世代都有那么几款游戏,像老朋友一样,陪我们度过了无数个日夜,留下了深刻的记忆。既然你问到了本世代(我理解是 PS4/Xbox One 及其后续)的十大游戏,这可.............
  • 回答
    出发旅行前,和男朋友讨论房事安排是很正常也很重要的。如果这次旅行你暂时不想发生关系,但又想巧妙地表达自己的想法,同时保持亲密关系不受影响,可以试试以下几种方式:1. 坦诚沟通,温柔表达你的感受: 选择一个轻松愉快的时机: 在旅行前一天或者出发前的某个温馨时刻,比如一起收拾行李、一起喝咖啡聊天的时.............
  • 回答
    恭喜你即将迈入国家部委的大门!这是一份荣耀,更是一份沉甸甸的责任。在这样一个汇聚了国家智慧和执行力的平台工作,既是机遇也是挑战。如何快速适应、融入并做出一番成绩,以下是我为你准备的一些掏心窝子的话,希望能帮助你少走弯路,更好地开启你的部委生涯。一、 心态调整与角色认知: 放下“新人”包袱,但保持.............
  • 回答
    哎,哥们儿,我太懂你这感觉了!这不就跟我去年这个时候一模一样嘛,感觉一夜之间,整个世界都压过来了,喘不过气儿来。之前可能还瞎忙乎,现在突然就觉得目标明确了,但这个“目标”却像座大山一样,看着就腿软。我先跟你捋捋,为啥会有这股“突然”的压力吧。首先,时间节点到了,逼近感十足。 你想想,大一那会儿,日子.............

本站所有内容均为互联网搜索引擎提供的公开搜索信息,本站不存储任何数据与内容,任何内容与数据均与本站无关,如有需要请联系相关搜索引擎包括但不限于百度google,bing,sogou

© 2025 tinynews.org All Rights Reserved. 百科问答小站 版权所有