亲眼目睹了提问从“饱和”、“众神黄昏”到“灰飞烟灭”,现在隐隐有点期待明年的新词。我每年都会回答类似的问题,现在看来依然不过时。
因为对国内职场的了解有限,咱就不再过多分析具体的学习路线或者就业思路,而从策略上想想2020年以后机器学习开发岗的风向与侧重点。我觉得既然已经到了2020年,就应该有一个思路上的转变:从理论模型落到实际操作上去。以前的就业套路,包括硕士、本科生的套路都是学位+论文+会掉包就可以轻松就业。那么从两三年前开始,这条路已经走不通了,我觉得根据算法工程师、或者机器学习开发的角度来看,应该是学位+开发经验和过硬的工程能力+读的懂论文能实现就行。
核心区别就是要弱化工程岗的论文经历的权重,而提升对程序设计与开发、机器学习系统的理解。对于一个机器学习工程师而言,此处的工程能力是对于数据为先模型的设计(data intensive design)的重视。这跟传统的软件工程不一样,机器学习模型的开发跟数据交互更加频繁,数据的吞吐量更大,且不确定性更多。在我看来,对于机器学习模型和系统的设计要考虑到:
在这些基础上,我觉得未来的机器学习工程师可以在机器学习、深度学习以外,看一些数据挖掘、并行系统、系统架构类型的书。倒也不是为了成为这些领域的专家,但工程师的职责就是保证项目能够稳定的上线。所以吧,重点就是以后别啥都奔着发论文去了,看点实际的、接地气的,现实生活中能用到的技术。就算以后AutoML把调参师替代了,至少还得有人去做AutoML的系统,或者至少可以退回到做软件开发。
这里科普个小知识,数据挖掘和机器学习的区别在哪里?我觉得前者可以被叫做应用机器学习(applied ML),更在意部署和可扩展性,因此更接地气更在乎应用。有时候数据挖掘领域的论文没那么高大上,但的确管用,毕竟是很多企业拿真实数据喂出来的。以前吧,数据挖掘一直在AI鄙视链的底端,但随着落地需求的上升,我反而觉得有逐渐回春的意思。
抛开AutoML的逐步进展(虽然在绝大部分领域还不可用),考虑到加上机器学习工程师的收入已经逐步回归到了其他开发岗相似水平上。
是时候认清现实,当个真真正正的工程师了。
先介绍一本传统的数据挖掘教科书。虽然不新,但很经典:
数据密集型应用系统设计:Designing Data-Intensive Applications: The Big Ideas Behind Reliable, Scalable, and Maintainable Systems. 亚马逊有接近500个好评,值得一读。
互联网大规模数据挖掘与分析(我的师叔著)
我时常这么安慰自己。
全国第一批人工智能本科,2020年入学是第一届。现在本科点已超过150个。
算法岗基本需要读研。
也就是未来5年,还不是最卷的时候。
本站所有内容均为互联网搜索引擎提供的公开搜索信息,本站不存储任何数据与内容,任何内容与数据均与本站无关,如有需要请联系相关搜索引擎包括但不限于百度,google,bing,sogou 等
© 2025 tinynews.org All Rights Reserved. 百科问答小站 版权所有