百科问答小站 logo
百科问答小站 font logo



NLP现在就业是否没有前途? 第1页

  

user avatar   tsxiyao 网友的相关建议: 
      

刚出学校的时候肯定没问题,放在学术界当然也没问题。但如果放在工业界长期搞的话,对大部分人来说不太好。

工业界里,技术是为业务服务的,现在互联网现金牛的业务都不是靠单一技术撑起来的。无论网页搜索、图片搜索还是当下火热的视频搜索,它背后都是一套承载复杂业务逻辑的系统,单一的NLP、CV、Speech技术都只是其中一部分。

业务逻辑没搞清楚,系统模块之间如何互相影响没搞清楚,只是技术层面深度炼丹其中一个NLP模型、CV模型或者Speech模型的话,所能带来的系统层面的影响都非常有限。

一个视频搜索系统我能完全抛开视频视觉内容和语音内容来做吗?

一个图像检索系统我能完全抛开图像视觉内容来做吗?

一个网页检索系统我能完全抛开网页内容来做吗?

其实全都可以。

离了深度学习下的NLP、CV、Speech模型,这些业务系统总能找到一些巧妙的机器学习甚至非learning的方式达到不错的效果。

那这些先进NLP技术存在的意义是什么?

  1. 简化系统设计
  2. 解决系统里20%的疑难问题

比如搞文本相关性,如果抛开现代NLP模型,那就要一顿分词、term weighting、计算CQR/CTR等term match的一堆人工特征,要写不少代码,维护不少系统模块,可能勉强能上80%的准确率。换上现代NLP模型的话,随手上个BERT就80%了。前者需要几十个人维护好几个模块,后者需要一个初级NLP工程师+几台GPU部署机器。

所以啊,低端NLP人才,其实不用很多。一个人就能卷死一大片传统算法模块。

而剩下那20%的困难问题,老旧系统+tricky策略就实在搞不定了,BERT简单finetune也搞不定,咋办呢?

这就是大厂抢着要的高端NLP人才。校招卷潜力股,社招挖实力股。

还是以相关性为例,一些疑难case见我之前这个回答:

没混过大流量的搜索业务的话,做文本匹配的NLP工程师还是很难知道怎么用BERT解这类hard case的,一不小心就陷入了写规则的怪圈里。

解决这20%疑难问题的能力,是非常通用的。做网页搜索能用,放在图像搜索、视频搜索里同样整体适用,最多策略层面“做做微调”。

但要学会这些,你要进nb的团队有牛人带,在问题依托的场景里向牛人学习。这些东西一般写不到论文里,写到论文里往往你也找不到的。

所以,如果觉得踏进了NLP圈子就叫有前途,那还是洗洗睡了。但如果能:

  1. 成为nb的nlp工程师,至少能解属于NLP的20%疑难问题
  2. 跳出nlp圈子,多关注业务、系统和通用机器学习套路

有其一的话,就能打开前途天花板。两者兼得那更好不过了。

越工作越发觉得,前途不前途的,还是要看自己的机遇和选择。

下面是我和小伙伴四年以来的努力,希望能成为每个算法从业者成长路上的一束光:

手册大约半年更新一次,每周大约会有2-3篇新内容产生,对新内容有期待的小伙伴,欢迎follow我们的公号“夕小瑶的卖萌屋”,希望多多支持鸭~~


user avatar   vtt-94 网友的相关建议: 
      

其实这完全是意料之内的翻车。

有心的朋友其实可以去翻找一下MIUI的部门等级变化,就会发现一个极其有趣的现象,目前翻车的两个版本,包括13和12.5,基本上都是内部等级降级后的MIUI团队制作出来的。

可能有人不是很懂这跟内部部门等级升降有什么关系。

简单来说就是,一个部门内部等级越高,它的部门领导距离核心层也就越近,甚至直接就是核心层,它能得到的资源也好,能得到的重视程度也好,都不是普通中高层执掌的部门所能比的。

MIUI作为小米起家的重要支撑,早期等级是相当高的,雷军和部分联合创始人都曾经是它的负责人,所以在小米公司的内部,它的权重无疑是很高的,甚至于其他部门需要配合MIUI部门展开一些工作。

但在后来,MIUI的部门被分拆了,主要负责系统开发的联合创始人离开小米,取而代之的是金凡。领导地位和部门地位双降意味着MIUI的权重大大降低,至少已经不复以前风光了,而版本更新,在有限的资源投入的前提下,自然也只能做修补性的工作,亦或者是一些市面上友商已经有的功能进行技术性移植。无他,这样成本最低。

但这样的后果是严重的,因为友商的系统,即使同源,也会有不同的开发逻辑和技术实现逻辑,强行技术移植,带来的就是不稳定甚至是出现严重问题。

很多人说金凡负责的前几个版本也没问题啊。那是因为问题没有爆发,当时的MIUI还享受着前期资源带来的红利。只是到了12.5,红利已经吃完,问题开始显现而已。

解决这个问题的方式也简单,把MIUI的开发部门恢复到以前的地位,让一个懂技术的核心高层去负责,然后,砸钱去开发、重写、调教,并适配。

表面看来是技术问题,实际上反映的,只是小米部门调整策略出现问题了而已,只是这个后果是消费者承担。




  

相关话题

  Transformer中的Mask矩阵已经有顺序了,能去掉position embedding吗? 
  graph convolutional network有什么比较好的应用task? 
  如何看待 Daniel Povey 离开 JHU 后加入小米? 
  为什么不能有把中文想法直接转换成电脑程序的编程呢? 
  如何评价剑桥,腾讯, DeepMind以及港大团队新作 SimCTG ? 
  Bert中的词向量各向异性具体什么意思啊? 
  在CV/NLP/DL领域中,有哪些修改一行代码或者几行代码提升性能的算法? 
  BERT模型可以使用无监督的方法做文本相似度任务吗? 
  如何评价浪潮发布的2457亿参数源1.0智能大模型?与GPT-3相比如何?处于AI模型领域什么水平? 
  在NLP上,CNN、RNN(认为LSTM等变体也是RNN)、最简单全连结MLP,三者相比,各有何优劣? 

前一个讨论
澳洲的护理本科有多难学?
下一个讨论
如何评价DALL-E模型的实现?





© 2024-06-04 - tinynew.org. All Rights Reserved.
© 2024-06-04 - tinynew.org. 保留所有权利