刚出学校的时候肯定没问题,放在学术界当然也没问题。但如果放在工业界长期搞的话,对大部分人来说不太好。
工业界里,技术是为业务服务的,现在互联网现金牛的业务都不是靠单一技术撑起来的。无论网页搜索、图片搜索还是当下火热的视频搜索,它背后都是一套承载复杂业务逻辑的系统,单一的NLP、CV、Speech技术都只是其中一部分。
业务逻辑没搞清楚,系统模块之间如何互相影响没搞清楚,只是技术层面深度炼丹其中一个NLP模型、CV模型或者Speech模型的话,所能带来的系统层面的影响都非常有限。
一个视频搜索系统我能完全抛开视频视觉内容和语音内容来做吗?
一个图像检索系统我能完全抛开图像视觉内容来做吗?
一个网页检索系统我能完全抛开网页内容来做吗?
其实全都可以。
离了深度学习下的NLP、CV、Speech模型,这些业务系统总能找到一些巧妙的机器学习甚至非learning的方式达到不错的效果。
那这些先进NLP技术存在的意义是什么?
比如搞文本相关性,如果抛开现代NLP模型,那就要一顿分词、term weighting、计算CQR/CTR等term match的一堆人工特征,要写不少代码,维护不少系统模块,可能勉强能上80%的准确率。换上现代NLP模型的话,随手上个BERT就80%了。前者需要几十个人维护好几个模块,后者需要一个初级NLP工程师+几台GPU部署机器。
所以啊,低端NLP人才,其实不用很多。一个人就能卷死一大片传统算法模块。
而剩下那20%的困难问题,老旧系统+tricky策略就实在搞不定了,BERT简单finetune也搞不定,咋办呢?
这就是大厂抢着要的高端NLP人才。校招卷潜力股,社招挖实力股。
还是以相关性为例,一些疑难case见我之前这个回答:
没混过大流量的搜索业务的话,做文本匹配的NLP工程师还是很难知道怎么用BERT解这类hard case的,一不小心就陷入了写规则的怪圈里。
解决这20%疑难问题的能力,是非常通用的。做网页搜索能用,放在图像搜索、视频搜索里同样整体适用,最多策略层面“做做微调”。
但要学会这些,你要进nb的团队有牛人带,在问题依托的场景里向牛人学习。这些东西一般写不到论文里,写到论文里往往你也找不到的。
所以,如果觉得踏进了NLP圈子就叫有前途,那还是洗洗睡了。但如果能:
有其一的话,就能打开前途天花板。两者兼得那更好不过了。
越工作越发觉得,前途不前途的,还是要看自己的机遇和选择。
下面是我和小伙伴四年以来的努力,希望能成为每个算法从业者成长路上的一束光:
手册大约半年更新一次,每周大约会有2-3篇新内容产生,对新内容有期待的小伙伴,欢迎follow我们的公号“夕小瑶的卖萌屋”,希望多多支持鸭~~
本站所有内容均为互联网搜索引擎提供的公开搜索信息,本站不存储任何数据与内容,任何内容与数据均与本站无关,如有需要请联系相关搜索引擎包括但不限于百度,google,bing,sogou 等
© 2025 tinynews.org All Rights Reserved. 百科问答小站 版权所有