刚出学校的时候肯定没问题,放在学术界当然也没问题。但如果放在工业界长期搞的话,对大部分人来说不太好。
工业界里,技术是为业务服务的,现在互联网现金牛的业务都不是靠单一技术撑起来的。无论网页搜索、图片搜索还是当下火热的视频搜索,它背后都是一套承载复杂业务逻辑的系统,单一的NLP、CV、Speech技术都只是其中一部分。
业务逻辑没搞清楚,系统模块之间如何互相影响没搞清楚,只是技术层面深度炼丹其中一个NLP模型、CV模型或者Speech模型的话,所能带来的系统层面的影响都非常有限。
一个视频搜索系统我能完全抛开视频视觉内容和语音内容来做吗?
一个图像检索系统我能完全抛开图像视觉内容来做吗?
一个网页检索系统我能完全抛开网页内容来做吗?
其实全都可以。
离了深度学习下的NLP、CV、Speech模型,这些业务系统总能找到一些巧妙的机器学习甚至非learning的方式达到不错的效果。
那这些先进NLP技术存在的意义是什么?
比如搞文本相关性,如果抛开现代NLP模型,那就要一顿分词、term weighting、计算CQR/CTR等term match的一堆人工特征,要写不少代码,维护不少系统模块,可能勉强能上80%的准确率。换上现代NLP模型的话,随手上个BERT就80%了。前者需要几十个人维护好几个模块,后者需要一个初级NLP工程师+几台GPU部署机器。
所以啊,低端NLP人才,其实不用很多。一个人就能卷死一大片传统算法模块。
而剩下那20%的困难问题,老旧系统+tricky策略就实在搞不定了,BERT简单finetune也搞不定,咋办呢?
这就是大厂抢着要的高端NLP人才。校招卷潜力股,社招挖实力股。
还是以相关性为例,一些疑难case见我之前这个回答:
没混过大流量的搜索业务的话,做文本匹配的NLP工程师还是很难知道怎么用BERT解这类hard case的,一不小心就陷入了写规则的怪圈里。
解决这20%疑难问题的能力,是非常通用的。做网页搜索能用,放在图像搜索、视频搜索里同样整体适用,最多策略层面“做做微调”。
但要学会这些,你要进nb的团队有牛人带,在问题依托的场景里向牛人学习。这些东西一般写不到论文里,写到论文里往往你也找不到的。
所以,如果觉得踏进了NLP圈子就叫有前途,那还是洗洗睡了。但如果能:
有其一的话,就能打开前途天花板。两者兼得那更好不过了。
越工作越发觉得,前途不前途的,还是要看自己的机遇和选择。
下面是我和小伙伴四年以来的努力,希望能成为每个算法从业者成长路上的一束光:
手册大约半年更新一次,每周大约会有2-3篇新内容产生,对新内容有期待的小伙伴,欢迎follow我们的公号“夕小瑶的卖萌屋”,希望多多支持鸭~~
其实这完全是意料之内的翻车。
有心的朋友其实可以去翻找一下MIUI的部门等级变化,就会发现一个极其有趣的现象,目前翻车的两个版本,包括13和12.5,基本上都是内部等级降级后的MIUI团队制作出来的。
可能有人不是很懂这跟内部部门等级升降有什么关系。
简单来说就是,一个部门内部等级越高,它的部门领导距离核心层也就越近,甚至直接就是核心层,它能得到的资源也好,能得到的重视程度也好,都不是普通中高层执掌的部门所能比的。
MIUI作为小米起家的重要支撑,早期等级是相当高的,雷军和部分联合创始人都曾经是它的负责人,所以在小米公司的内部,它的权重无疑是很高的,甚至于其他部门需要配合MIUI部门展开一些工作。
但在后来,MIUI的部门被分拆了,主要负责系统开发的联合创始人离开小米,取而代之的是金凡。领导地位和部门地位双降意味着MIUI的权重大大降低,至少已经不复以前风光了,而版本更新,在有限的资源投入的前提下,自然也只能做修补性的工作,亦或者是一些市面上友商已经有的功能进行技术性移植。无他,这样成本最低。
但这样的后果是严重的,因为友商的系统,即使同源,也会有不同的开发逻辑和技术实现逻辑,强行技术移植,带来的就是不稳定甚至是出现严重问题。
很多人说金凡负责的前几个版本也没问题啊。那是因为问题没有爆发,当时的MIUI还享受着前期资源带来的红利。只是到了12.5,红利已经吃完,问题开始显现而已。
解决这个问题的方式也简单,把MIUI的开发部门恢复到以前的地位,让一个懂技术的核心高层去负责,然后,砸钱去开发、重写、调教,并适配。
表面看来是技术问题,实际上反映的,只是小米部门调整策略出现问题了而已,只是这个后果是消费者承担。