百科问答小站 logo
百科问答小站 font logo



如何快速入行数据分析师? 第1页

  

user avatar   mu-tou-zi-59 网友的相关建议: 
      

不请自来,这个话题我应该是有一定的发言权的。因为我本科是高分子,研究生专业是材料工程,今年毕业。但是在研一的时候接触了编程,用的语言是Python(还好一开始学的是Python),之后在课程结束之后寻找一个未来的方向,因为听说数据分析挺火的,于是我就尝试朝着数据分析方向学习。这一学习就是一年多的时间了,所以我算是完完全全转行,尽管之前本专业也有数据分析,但那些小打小闹的数据分析跟商业的数据分析完全不是一回事啊。期间去了一家人工智能公司实习了三个月。


个人看了一下楼上的回答,发现都或多或少有些偏题了,问题关键词是“快速”,“入行”,“数据分析师”。


那么就按照这几个关键词答一下吧。


我个人倾向于先确定一个非常非常具体的目标,然后再去反过来规划自己的行动并且在行动的过程中去不断调整。


入行


首先是“入行”和“数据分析师”,那么你首先要知道要入什么行。“数据分析”这个词太宽泛了,从等级上来说有数据分析员(大专就能做的)->数据分析师(本科及硕士)->数据科学家(有很专业知识的博士或者由数据分析师多年经验值积累进化而成),我认为题主问的应该是数据分析师;从行业上来说,我们看看。


从行业上来看,有金融数据分析师,有对用户增长的数据分析师,也有分析用户情况建立用户画像之类的数据分析师……但大同小异,互联网公司除了研究的数据类型(教育,视频,生活服务等)有不同,其实做的事情很多都是大同小异的,在这里多说一句我认为金融数据分析其实稍微有些特别,它更多不依赖于用户,而是对数据进行建模,然后利用建立的模型去做一些预测或者是建立算法进行量化交易。



从用的工具上来说,由于每个行业研究的内容还有数据的体量都不同,因此工具的侧重点并不是完全重合的。比如,我知道百度外卖用的就是excel,美团以及大家耳熟能详的一些大公司都有招只要会ppt和excel以及sql的数据分析师;金融分析我知道用得比较多的是Python,R,SAS(SAS是金融行业的特征),大数据还有计算机平台其实涉及得不多(也就是你不会linux不会大数据工具也能进);对于一部分的互联网行业,一般除了Python和R,一般要会SQL和linux,并且要有比较可靠的数据挖掘基础和经历;然后,旗鼓相当的另一部分互联网行业是要掌握大数据工具,如Hadoop,HIVE。这一部分工具门槛就会稍高一些,但数据分析原理是一样的。


快速


我十分同意楼上大牛的回答,实际上并没有什么快速方法。就算是天才也得掌握重要的统计学知识,数据分析技能才能做数据分析。理论上学习一门新知识和新本领实际上并不用花那么多时间(除了成为专家),但实际上花的时间是远超于头脑中以为所需的时间。原因是我们都无意走了很多弯路,如果我们把快速学习定义为尽可能少走或者不走弯路地去掌握重要的知识和技能,并且能够快速转化到实际应用,那么这是可行的。只要你一直坚持用正确的方式做正确的事,那么你实际上就是在快速的通道上,但是该积累的一项不能落下,有时候积累是个看起来比较长的时间,但是它们都是必要的。


学习的方式


这里的学习方式是我自己定义的,一年以来深有体会。


横向学习方式


横向学习方式就是按照上面各位大牛所列出的东西一个一个攻克,先把统计学、线性代数以及积分的课本啃熟了,然后把Python和R语言学习掌握了,然后学习机器学习,包括机器学习的概念,常用的算法,机器学习的流程等等,然后把相关的业务背景了解,阅读相关书目,关注相关公众号,如此学习。但我十分不推荐这种按部就班的学习方式,因为这没几个人会坚持得下来,每个阶段都是一个大部头,容易枯燥乏味,而且每个学习阶段都跟下一个学习没有交叉,这样很不利于理解和运用。


项目驱动+调研学习


与横向学习不同,我推荐以项目驱动学习的方式,这种学习方式也是互联网公司里面的工作方式,也就是给定一个项目,最终实现某个目标,达到一定的指标。项目驱动学习的好处是可以同时调用你很多的知识点和技能,并且强调动手而不是光看书或看视频,另外在解决项目遇到的问题的过程中,其实也培养了你分析问题和解决问题的思维和能力,这些能力在后续转行的时候面试其实会被面试官很关注。


比如说如果你要完成一个基于客户的购买行为的聚类分析的项目,那么你就会要走一套相关的流程。首先就得要对项目的背景有所了解->数据的结构->数据的清洗->探索性分析->特征工程的转化->建模->调试模型->评估模型->最后做出你的结论。其中你有可能在某个环节会遇到问题,比如说聚类分析的概念不明白,特征工程有哪些处理方式,这个问题有哪几类模型可能合适等等。这个时候你就需要调用第二个学习方式,就是主题调研式学习。这种学习要求你围绕一个你不懂的概念或者主题进行相关资料的搜索,包括向助教请教、国外优秀的博客、论坛以及相关的实现的文档进行查阅,然后整理成用自己话描述的东西。在这个过程中,由于你从各个方面深入了解了这个概念,不仅对你完成项目有很大帮助,而且你在以后再碰到类似的概念你也可以迎刃而解。


如图是我完成”金融风险管理:风险价值VaR和局部均值ES的度量”这个小项目的过程,从0开始,跟着课程走,遇到问题自己查阅相关资料,写出自己的理解,从而加深认识的方式。在这个过程中,我通过围绕这个主题进行调研,然后把自己的认识按照通俗易懂的大白话方式解释了VaR和ES的概念,计算方式以及为什么要这么计算,运用相关模型的前提又是什么。整个过程就是一个费曼学习法的过程,形成一个闭环,而且以后遇到新的认识还可以继续迭代,并且我以后还可以把它打印出来,作为我面试时候证明项目经历的重要资料。


其实数据分析说难也并不难,学习都是从简单到复杂的过程。我一开始学习数据分析的时候,也是对着泰坦尼克号乘客生还率那个数据集画出几个柱状图看出点趋势就高兴得不行,这就是我一开始最简单的demo。但最简单的数据分析也是走完一套相同的完整流程的。如果你把一开始很简单的项目看成是一个demo的话,只要你不断去像程序员一样迭代自身对整套流程的完成能力,你迟早能成为一名很熟练的数据分析师,然后再去更新自己更高阶的技能。


关于课程推荐


关于课程,我建议付费学习,付费学习比免费学习有多很多重要的东西,这里不展开。不管报哪家的,入门的课程一定要有以下这些元素,否则新手是很难坚持下来的。


  1. 有趣容易上手
  2. 大纲清晰且完整
  3. 重视动手
  4. 有明确的审阅反馈
  5. 能够为就业提供有效支持


其中有趣容易上手是为了容易开始;一定要有完整且清晰的大纲,相当于地图的指引;数据分析是一门技能,一定要既学也练;明确有效的反馈是刻意练习的必要;最后一点是为了入行做准备。

关于课程的比较,我在网易云课程,Udemy以及Coursera还有Udacity以及实验楼都有过相关学习经验,说一下作为参考吧。首先是学习的资源基本上都是视频,前面三个课程学员跟课程讲师和助教的互动性比较差,学员一般通过课程留言来提问,但是这样回应时间很长,而且不一定有回应,十分消耗时间和耐心。如果题主自学能力比较强的话推荐Udemy的数据分析课程,一般一个课程都有比较完整的大纲,比如我最近就在学‘Python for Financial Analysis and Algorithmic Trading’‘Quantitative Finance & Algorithmic Trading in Python’这两个课程,如果有耐心慢慢学的话,Udemy是不错的选择。


我没有学过Coursera的数据分析课程,但是有跟过吴恩达很有名的机器学习课程,我个人觉得Coursera更适合作为补充学习材料,原因是Coursera里面更接近于大学的内容,书生气比较重一些,适合补充对于数据分析原理方面的知识,我在吴恩达的课程里面从数学上理解了很多算法的原理。


对于网易云课堂,就我报过的一个很受欢迎的爬虫课来说,都有几年时间了,我还没完成。其他课程我没有发言权,但我对网易云课堂的课程服务不是很满意,不够完善,而且不知道是不是只有我有这个问题,关于编程我不喜欢听中文的课程,原因是各种概念其实用中文名解释很不够直观,网易云课堂的老师就有这样的问题,很多概念一下子抛过来也不解释下,现在的教学服务有没有完善我不是很清楚。但现在我主要的学习途径也是英语的,我个人对英语的解释理解更加容易,不过也是看每个人的情况不同,什么课程合适就来什么。

如果题主觉得一个人学比较没劲或者遇到困难想找人解答,可能优达的数据分析师课程比较适合。但是优达的项目有一定难度,并且有时限,适合有一定基础能够抽出一定时间坚持学习才能完成项目的人,如果是时间不能保证的话还是建议先考虑下。我当时作为小白刚开始学习优达的数据分析项目的时候,真的是看到代码就头疼,也是磕磕碰碰做完项目的,但是做项目码代码来实现目标我感觉才是真正的学习和进步,当我真正经历了那种痛苦做完一个又一个的项目,最终取得毕业证书,我是超级兴奋的,在这个过程中我还学到了很多学习方法和自我管理,有兴趣也可以关注一下我的专栏:高效学习



实验楼可能不太适合入门,但比较适合做一些动手的练习,或者是做一些简短的小项目,把自己学到的东西应用起来,比如我就在上面完成了pandas的数据分析训练营课程,还有R语言实现风险度量的计算,航班时序分析等简短的项目,这些写进简历也是很不错的。


我的建议是如果是小白入门的话最好先选一些简单的入门课程比如Udemy或者是网易云或者是cousera的统计学和编程课程,但有了一定基础后一定要去做一些完整的数据分析项目(比如我选择了优达学城的项目,适合作为求职项目经历),了解数据分析的流程,把所学应用起来,然后把这些做过的项目都写到简历里面。

关于项目的相关资料可以在相关的github或者是kaggle上面下载,抑或是在优达学城通关打怪或者实验楼上面做一些简单的项目。

一些建议:题主如果想入行数据分析的话,实际上是不难的,先要用20%的时间把80%最重要的东西先学到手,掌握了,其他的再慢慢去提升。个人一年来小白入门的感悟就是,每个阶段其实都会有自己要做的事,每个阶段也有只有这个阶段才能理解和掌握的事情,比如Linux操作系统,机器学习,以及大数据,你这些就可以统统先不去管了,因为门都还没入呢。而且我发现其实楼上那些回答,你现在不看也没事,等到你入了数据分析的门,有半年或者一年的时间后,你自然就会去搜索相应的回答去知道自己未来要往哪边走,现在你可能对楼上的各位大牛的回答并没有太多的感觉,半年后你回过头来看会有更多有益的收获。

最近在知乎看到曾加老师在另一个问题当中的回复,算是对我的回答做一个补充:参考从零开始学数据分析,什么程度可以找工作?




  

相关话题

  如何证明数据增强(Data Augmentation)有效性? 
  机器学习里的 kernel 是指什么? 
  支持向量机(SVM)是什么意思? 
  在哪里能找到各行业的分析研究报告? 
  数据分析师(非数据挖掘,偏业务)是青春饭吗? 
  Jupyter Notebook 有哪些奇技淫巧? 
  有哪些数据风向标更好地预测了这次美国总统选举结果? 
  从进化的角度看,实现强人工智能,究竟是数据重要还是模型重要? 
  国内外有哪些比较权威的统计数据网站? 
  数据分析师(非数据挖掘,偏业务)是青春饭吗? 






© 2024-06-26 - tinynew.org. All Rights Reserved.
© 2024-06-26 - tinynew.org. 保留所有权利