百科问答小站 logo
百科问答小站 font logo



为什么nlp没有像cv四小龙一样的创业公司? 第1页

  

user avatar   wu-yu-0427 网友的相关建议: 
      

NLP创业就是“挣得不够油钱的2B,技术仍需努力的2C”

1、挣得不够油钱的2B。过去30年来,为什么计算机行业利润大估值高?因为可扩展性,做一个软件可以服务全球上亿用户(不管是2B还是2C),从而一劳永逸。

而NLP的2B创业却又是另一个故事了。NLP 2B业务实在太难扩展,这导致NLP创业公司给A公司做的几乎无法移植给B公司。做一单挣一单的钱,完全没有可扩展性。接下来给大家算一笔账,如果一个项目5个工程师,按照人力成本50万来看,一个项目如果半年光人力成本就要125万。而项目真正的成本往往要是人力成本的1.5到2.5倍(差旅费,宴请费,如果驻场开发还有会有 食宿等费用),光成本就要250万。而据我所知,真实情况是什么呢?一个200万的项目,参与的开发者往往是20人,1000万的项目参与的开发者就要达到50到一百人。这导致NLP 2B创业利润太薄,甚至做一单亏一单。PS:当然,也有一单挣很多的,这往往就要扯到中国式关系和利益交换了。

更为艰难的是目前NLP创业,还有很多基于高校的公司,高校团队由于人力成本的优势,导致经常扮演价格杀手的角色,把市面的单价谈的一低再低。

目前2B的NLP创业,非常像之前的软件外包行业。活儿也有,但是很苦,甚至驻场开发。我想起当初和一个软件外包行业成立20年不衰的公司聊天的内容:“虽然你和我都是做计算机的,但我们从事的完全两个行业。我们这行每单利润不高,公司挣不了大钱。我只招二本的,二本学生有水平很好的,而且相比一本的同学人老实,我招的一本的工资涨得不够快,很快就走了,二本的往往踏踏实实干活,不跳槽。”

于此同时,我觉得如果不进行资本游戏,只进行算法的售卖,非但nlp没有像样的创业公司,cv四小龙能不能靠卖出的算法养活自己都不好说。

2、技术仍需努力的2C。NLP当今技术从实验室走向落地,最大的障碍是“鲁棒性”。NLP有多不鲁邦呢?举一个前几个月很火的例子:You play basketball like Caixukun 翻译成了你篮球打得真好。

很多特殊的词语(例如人名)还有符号都会对目前系统有很大干扰。试想这种情况,我们出国的时候怎么让机器翻译系统搞定特殊词语更多的菜单呢?与之类似,语音识别也有同样的问题,当背景嘈杂的时候,当你有口音的时候,系统都从人工智能变成人工智障

这种模型的不鲁棒性让2C离真正的让大家放心地用,爽快地用还有很大距离。

另外,我不认为创业公司,乃至大公司之间有很大的“软件上”的技术壁垒。随着arXiv, Github的流行和普及,把经典开源代码加以利用和改进,往往成了创业公司甚至大公司 “吹牛逼”的范式。而当技术没那么值钱的时候,可能场景,以及用户才是创业公司真正需要思考的地方吧。


user avatar   yao-dong-27 网友的相关建议: 
      

智能分为感知智能和认知智能,对应到人工智能领域也可以这么划分。

感知是比较低级的智能,即使是很低端的生物都具有感知智能。

计算机视觉领域的问题大多属于感知智能,比如 图片的分类 识别 物体检测分割 人脸识别检测等等。感知智能是很容易有客观评价标准的,也容易数据驱动,算法上容易实现和迭代优化。但是感知智能的问题在于 知其然而不知其所以然,就是没有逻辑推理,没有因果分析,泛化能力受限。

AlphaGo虽然下围棋很强,但是它仍然是感知智能,它知道每一步在哪里落子,但是它无法给出完善的理由,无法给出推理过程。人类在下围棋的时候使用的是认知智能,人类棋手总要给每一步找出个理由,做好逻辑推理演算,但是最终结果还不如AlphaGo凭直觉给出的答案。这就好比,鸟类可以完美飞行,但是鸟类并不懂空气动力学,空气动力学家通过公式推导和计算得出的结论未必就比鸟类的飞行动作更合理。但是你不能以此说明鸟类比空气动力学家更有智能。

而NLP领域的问题绝大多数都是认知智能问题,因为语言已经是人类对于现实世界和逻辑概念的高级抽象符号化后的结果了,感知的部分人类已经做完了,也就是说语言文字已经是感知智能处理后的结果了,留给NLP的就是认知问题了。

以目前的技术水平,还不能很好处理认知问题,自然就不会有NLP明星创业公司,一些普通的NLP相关创业公司还是有的,比如 舆情监控 机器翻译 人机对话等方向,由于技术的局限性,融资规模不会像 CV 四小龙那么夸张。


user avatar   dang.xinran 网友的相关建议: 
      

因为NLP/语音识别技术还不成熟,外加没有很好用的麦克风、传感器、滤波等工具,做不成end-to-end的方案卖给大客户,因此无法像CV一样直接在安防领域一落地就能拿到几百亿的钱。

什么时候NLP技术成熟到了可以不依赖平台就做到end-to-end的安防方案了,比如你一开口说华为的坏话,云端服务器能立刻自动报警来羁押你251天,准确率能达到超越人类的水平,那么NLP这些技术就可以真正落地了,到时候也会有几百亿的市场来供养这些创业公司了。




  

相关话题

  做底层 AI 框架和做上层 AI 应用,哪个对自己的学术水平(或综合能力)促进更大? 
  如何评价论文「Stochastic Training is Not Necessary ...」? 
  mxnet的并行计算为什么这么牛,是什么原理? 
  为什么做机器学习的很少使用假设检验? 
  PyTorch中在反向传播前为什么要手动将梯度清零? 
  27岁了跨考计算机研究生会不会太晚? 
  2021 年各家大厂的 AI Lab 现状如何? 
  计算机视觉顶级会议论文中比较适合初学计算机视觉的人做的复现实验有哪些? 
  NLP 中 prompt learning 有哪些可能的天生缺陷?目前有什么样的方法来解决这样的缺陷? 
  2019年NeurIPS有哪些糟糕的论文? 

前一个讨论
近十年来编译器有哪些关键的技术进步?
下一个讨论
信息熵与热力学统计物理中的熵有什么区别和联系?





© 2024-05-16 - tinynew.org. All Rights Reserved.
© 2024-05-16 - tinynew.org. 保留所有权利