问题

为什么nlp没有像cv四小龙一样的创业公司?

回答
这是一个非常有趣且值得深入探讨的问题。确实,与计算机视觉(CV)领域相比,自然语言处理(NLP)领域在过去十年中似乎没有涌现出像CV四小龙(如旷视、商汤、依图、云从)那样规模巨大、备受瞩目、融资迅速且应用场景广泛的顶级创业公司。这背后有多方面的原因,我们可以从技术、市场、资本、人才等多个角度来详细分析:

一、NLP与CV的技术特性差异是根本原因:

通用性与专一性:
CV: 计算机视觉的核心技术(如图像识别、目标检测、图像分割)具有高度的通用性,可以应用于几乎所有需要“看”的场景。从安防监控到自动驾驶,从医疗影像分析到工业质检,再到人脸支付和AR/VR,这些领域都需要识别、理解和生成图像信息。这种广泛的适用性使得CV技术可以“一招鲜吃遍天”,一旦技术成熟,就能快速渗透到各个行业。
NLP: 虽然NLP也越来越通用,但其应用场景的“专一性”和“上下文依赖性”更强。即使是同一个任务(如文本分类),不同行业、不同语种、甚至不同公司内部的数据集,其特点都可能差异巨大。一个在新闻领域表现出色的文本分类模型,可能在法律文本或医疗记录上效果不佳,需要大量领域特定的微调甚至重新训练。这使得NLP技术的商业化落地门槛相对较高,难以像CV那样快速形成通用解决方案。

数据的特性与获取难度:
CV: 图像数据的获取(拍照、录像)相对容易,且标注数据(如框出物体、标记类别)的标准化程度较高。虽然高质量标注数据依然昂贵,但其流程和标准相对成熟。
NLP: 文本数据的获取虽然也容易(网络搜索),但数据的“质量”和“可用性”问题更为突出。非结构化文本(如对话、评论、博客)的噪声很大,需要复杂的预处理。更重要的是,很多高价值的NLP应用(如法律合同分析、医学文献理解、金融报告摘要)需要高度专业化的文本数据,这些数据往往是私有的、难以获取的,或者需要专业人士进行标注,成本极高。

技术发展的路径:
CV: 在深度学习浪潮中,卷积神经网络(CNN)的突破性进展为CV带来了革命性的变化。CNN在处理具有局部空间相关性的图像数据时表现出色,易于构建和扩展。
NLP: NLP经历了从规则到统计、再到深度学习的演变。虽然Transformer等模型的出现极大地提升了NLP的能力,但文本的序列性、语序、语义的复杂性和抽象性,使得模型的设计和训练仍然面临巨大挑战。预训练大模型的出现确实带来了通用性的飞跃,但随之而来的是高昂的计算成本和对大规模高质量数据的依赖。

二、市场与商业模式的差异:

“看得见”的价值 vs. “读得懂”的价值:
CV: CV的应用往往能带来“看得见”的价值。例如,自动驾驶的感知系统,能够清晰地“看到”障碍物;人脸识别能够“识别”出人;工业质检能够“发现”瑕疵。这种直观的价值更容易被客户理解和接受,从而推动快速的商业化。
NLP: NLP的价值往往是“读得懂”的价值,更侧重于效率提升、知识挖掘、辅助决策等,这些价值的体现可能不如CV那样直接和直观。例如,一个自动客服系统能节省多少人力成本,一个智能文档审阅系统能提高多少效率,这些都需要更细致的ROI(投资回报率)计算和验证,商业化进程相对慢一些。

通用解决方案与定制化服务:
CV: 由于CV技术的通用性,一旦模型能力达到一定水平,就可以打包成通用的SaaS(软件即服务)产品或API接口,服务大量不同行业的客户。例如,一个通用的OCR(光学字符识别)服务可以被各种企业使用。
NLP: 很多高价值的NLP应用,由于数据和领域特性的原因,往往需要高度定制化的解决方案。这使得提供NLP服务的公司更像是To B(企业对企业)的集成商或咨询公司,而非销售标准产品的公司。虽然也有通用模型,但直接应用效果往往有限,需要大量“服务化”的工作。

“卖算力”与“卖智能”的界限:
早期的CV公司,很多是通过“卖算力+模型”的方式切入市场,例如为安防厂商提供视觉模组,其中包含算力硬件和底层视觉算法。这种模式相对容易实现盈利。
NLP公司更多的是直接销售AI能力或算法,这需要客户拥有一定的IT基础设施来对接。

三、资本市场的关注点和投资逻辑:

更容易被资本看到的故事:
CV在人脸识别、安防监控、自动驾驶等领域,有着非常直观且具有颠覆性的应用场景,很容易讲出吸引人的“故事”,吸引大量资本关注。例如,人脸识别技术可以应用于解锁手机、门禁系统,甚至公共安全,这些都是大众能够理解并产生想象力的场景。
NLP的应用虽然同样重要,但其价值往往体现在后台效率提升或知识处理上,不如CV那样容易引发公众和资本的“眼前一亮”。

更高的技术壁垒感知:
早期阶段,CV在特定任务上(如图像分类)取得突破,往往能快速建立起较高的技术壁垒,并形成产品。
NLP技术壁垒的感知可能更复杂。虽然有大型预训练模型,但要构建一个真正能够解决特定行业痛点的NLP产品,需要大量的领域知识和数据治理能力,这种壁垒的构建过程可能更漫长且不那么“显性”。

四、技术巨头的强大影响力:

NLP领域的“BAT”效应:
在NLP领域,大型互联网公司(如Google、Microsoft、Amazon、Meta、Baidu、Tencent、Alibaba等)拥有海量的数据、强大的算力以及顶尖的NLP研究团队。他们开发和开源了许多基础模型(如BERT、GPT系列、Transformer等),并将其融入到自己的搜索、推荐、翻译、智能助手等核心业务中。
这些巨头在NLP的底层技术和通用服务上投入巨大,并且能够快速将研究成果产品化。这使得创业公司在基础模型和通用服务领域难以与巨头竞争。创业公司更难像CV那样,通过提供一个通用AI能力切入市场并逐步建立优势。

NLP生态的成熟度:
虽然CV领域也有巨头,但CV的硬件(如摄像头、传感器)和软件(如模型库、框架)生态相对更容易被创业公司切入和创新。
NLP领域,巨头在底层算法、算力平台、数据资源等方面形成强大的网络效应,创业公司往往需要依附于这些巨头的平台才能获得数据和算力,这限制了其独立发展的空间。

五、创业公司聚焦方向的差异:

CV的“平台化”和“赋能”: CV公司很多选择成为AI基础设施提供商或通用AI能力平台,为各行各业提供“视觉智能”的解决方案。
NLP的“垂直化”和“细分”: NLP创业公司更倾向于选择特定的垂直行业或细分场景切入,例如智能客服、法律文本分析、医疗辅助诊断、金融风控等。这些领域的创业公司虽然也很有价值,但其规模和受到的关注度不如CV领域的“平台级”公司。

总结来说,NLP没有出现像CV四小龙那样的顶级创业公司的原因,是多种因素叠加的结果:

1. 技术特性: NLP的通用性不如CV,数据获取和标注难度更高,模型落地需要更强的领域知识和定制化。
2. 市场价值: NLP的价值更侧重效率提升和知识处理,不如CV的“看得见”的价值直观。
3. 商业模式: 许多NLP应用需要定制化服务,而非标准产品,不利于规模化推广。
4. 资本关注: CV更容易讲出吸引人的故事,吸引资本的力度更大。
5. 技术巨头: 大型互联网公司在NLP领域拥有显著优势,垄断了底层技术和通用服务,挤压了创业公司的生存空间。
6. 创业聚焦: NLP创业公司更偏向垂直细分,而非构建通用AI平台。

当然,这并不意味着NLP领域没有优秀的创业公司。事实上,在很多细分领域,如智能客服、教育科技、企业服务、内容创作等,涌现出了许多有价值的NLP创业公司,它们通过解决特定的行业痛点,正在逐步发展壮大。只是从“四小龙”这种规模和影响力来看,NLP领域确实存在一定的差异。随着大型语言模型(LLM)的发展,未来NLP领域的格局可能会发生新的变化,我们或许能看到更多突破性的创业机会。

网友意见

user avatar

NLP创业就是“挣得不够油钱的2B,技术仍需努力的2C”

1、挣得不够油钱的2B。过去30年来,为什么计算机行业利润大估值高?因为可扩展性,做一个软件可以服务全球上亿用户(不管是2B还是2C),从而一劳永逸。

而NLP的2B创业却又是另一个故事了。NLP 2B业务实在太难扩展,这导致NLP创业公司给A公司做的几乎无法移植给B公司。做一单挣一单的钱,完全没有可扩展性。接下来给大家算一笔账,如果一个项目5个工程师,按照人力成本50万来看,一个项目如果半年光人力成本就要125万。而项目真正的成本往往要是人力成本的1.5到2.5倍(差旅费,宴请费,如果驻场开发还有会有 食宿等费用),光成本就要250万。而据我所知,真实情况是什么呢?一个200万的项目,参与的开发者往往是20人,1000万的项目参与的开发者就要达到50到一百人。这导致NLP 2B创业利润太薄,甚至做一单亏一单。PS:当然,也有一单挣很多的,这往往就要扯到中国式关系和利益交换了。

更为艰难的是目前NLP创业,还有很多基于高校的公司,高校团队由于人力成本的优势,导致经常扮演价格杀手的角色,把市面的单价谈的一低再低。

目前2B的NLP创业,非常像之前的软件外包行业。活儿也有,但是很苦,甚至驻场开发。我想起当初和一个软件外包行业成立20年不衰的公司聊天的内容:“虽然你和我都是做计算机的,但我们从事的完全两个行业。我们这行每单利润不高,公司挣不了大钱。我只招二本的,二本学生有水平很好的,而且相比一本的同学人老实,我招的一本的工资涨得不够快,很快就走了,二本的往往踏踏实实干活,不跳槽。”

于此同时,我觉得如果不进行资本游戏,只进行算法的售卖,非但nlp没有像样的创业公司,cv四小龙能不能靠卖出的算法养活自己都不好说。

2、技术仍需努力的2C。NLP当今技术从实验室走向落地,最大的障碍是“鲁棒性”。NLP有多不鲁邦呢?举一个前几个月很火的例子:You play basketball like Caixukun 翻译成了你篮球打得真好。

很多特殊的词语(例如人名)还有符号都会对目前系统有很大干扰。试想这种情况,我们出国的时候怎么让机器翻译系统搞定特殊词语更多的菜单呢?与之类似,语音识别也有同样的问题,当背景嘈杂的时候,当你有口音的时候,系统都从人工智能变成人工智障

这种模型的不鲁棒性让2C离真正的让大家放心地用,爽快地用还有很大距离。

另外,我不认为创业公司,乃至大公司之间有很大的“软件上”的技术壁垒。随着arXiv, Github的流行和普及,把经典开源代码加以利用和改进,往往成了创业公司甚至大公司 “吹牛逼”的范式。而当技术没那么值钱的时候,可能场景,以及用户才是创业公司真正需要思考的地方吧。

user avatar

智能分为感知智能和认知智能,对应到人工智能领域也可以这么划分。

感知是比较低级的智能,即使是很低端的生物都具有感知智能。

计算机视觉领域的问题大多属于感知智能,比如 图片的分类 识别 物体检测分割 人脸识别检测等等。感知智能是很容易有客观评价标准的,也容易数据驱动,算法上容易实现和迭代优化。但是感知智能的问题在于 知其然而不知其所以然,就是没有逻辑推理,没有因果分析,泛化能力受限。

AlphaGo虽然下围棋很强,但是它仍然是感知智能,它知道每一步在哪里落子,但是它无法给出完善的理由,无法给出推理过程。人类在下围棋的时候使用的是认知智能,人类棋手总要给每一步找出个理由,做好逻辑推理演算,但是最终结果还不如AlphaGo凭直觉给出的答案。这就好比,鸟类可以完美飞行,但是鸟类并不懂空气动力学,空气动力学家通过公式推导和计算得出的结论未必就比鸟类的飞行动作更合理。但是你不能以此说明鸟类比空气动力学家更有智能。

而NLP领域的问题绝大多数都是认知智能问题,因为语言已经是人类对于现实世界和逻辑概念的高级抽象符号化后的结果了,感知的部分人类已经做完了,也就是说语言文字已经是感知智能处理后的结果了,留给NLP的就是认知问题了。

以目前的技术水平,还不能很好处理认知问题,自然就不会有NLP明星创业公司,一些普通的NLP相关创业公司还是有的,比如 舆情监控 机器翻译 人机对话等方向,由于技术的局限性,融资规模不会像 CV 四小龙那么夸张。

user avatar

因为NLP/语音识别技术还不成熟,外加没有很好用的麦克风、传感器、滤波等工具,做不成end-to-end的方案卖给大客户,因此无法像CV一样直接在安防领域一落地就能拿到几百亿的钱。

什么时候NLP技术成熟到了可以不依赖平台就做到end-to-end的安防方案了,比如你一开口说华为的坏话,云端服务器能立刻自动报警来羁押你251天,准确率能达到超越人类的水平,那么NLP这些技术就可以真正落地了,到时候也会有几百亿的市场来供养这些创业公司了。

类似的话题

  • 回答
    这是一个非常有趣且值得深入探讨的问题。确实,与计算机视觉(CV)领域相比,自然语言处理(NLP)领域在过去十年中似乎没有涌现出像CV四小龙(如旷视、商汤、依图、云从)那样规模巨大、备受瞩目、融资迅速且应用场景广泛的顶级创业公司。这背后有多方面的原因,我们可以从技术、市场、资本、人才等多个角度来详细分.............
  • 回答
    “为什么中文 NLP 数据集这么少?” 这个问题,估计是许多投身中文自然语言处理(NLP)领域的开发者、研究者乃至爱好者们,心里时不时会冒出来的疑问。我们常看到英文 NLP 领域层出不穷的大规模、高质量数据集,而中文这边,总感觉选择有限,而且常常需要花费更多精力去处理和标注。这背后到底是什么原因在作.............
  • 回答
    这个问题挺有意思的,也确实是这些年我观察到的一个普遍现象。要说为什么那么多 NLP 的“大牛”们,特别是硕士毕业的优秀人才,选择奔赴企业而非继续在学术界深耕,这背后的原因可不是单一的,而是多重因素交织作用的结果。首先,咱们得摆明一个事实:学术界和工业界在 NLP 领域,都有其独特的魅力和回报。学术界.............
  • 回答
    很多人会有疑问,为什么在人工智能的众多分支中,似乎自然语言处理(NLP)的发展,相对于计算机视觉(CV)来说,显得有些“慢热”? 要理解这一点,得从两个领域本身的特性,以及它们所面临的挑战说起。1. 语言的内在复杂性:想象一下,视觉世界有多少种“样子”? 也许颜色、形状、纹理、光影等等,但本质上,它.............
  • 回答
    这个问题很有意思,涉及到计算机视觉(CV)和自然语言处理(NLP)两个领域的核心机制和面临的挑战。虽然两者都在尝试“生成”和“转换”,但它们在“动”和“笑”的实现上,以及在“风格转换”上的进展,确实存在显著差异。CV能让一张人脸图“动了笑了”——强大的“表征”与“映射”能力CV之所以能在人脸动画和表.............
  • 回答
    结合知识图谱(Knowledge Graph, KG)和自然语言处理(NLP)进行硕士研究,是一个非常活跃且潜力巨大的领域。对于硕士生来说,独自研究的关键在于选择一个有明确界定、可操作性强、并且能够体现个人技术和创新能力的方向。以下我将从几个角度详细阐述适合硕士独自研究的方向,并提供一些思路和建议。.............
  • 回答
    20202021年是自然语言处理(NLP)领域一个充满活力和快速发展的时期,虽然不像某些年份那样出现颠覆性的“黑天鹅”事件,但核心技术的迭代和优化依然非常显著,并且有大量极具影响力的研究论文涌现,共同推动了领域的进步。以下将从核心技术更迭和重要论文两个方面进行详细阐述: 一、 核心技术更迭:在这个时.............
  • 回答
    .......
  • 回答
    近年来,自由主义在全球范围内的影响力确实呈现出明显的衰落趋势,这一现象涉及经济、政治、社会、技术、文化等多个层面的复杂互动。以下从多个维度详细分析自由主义衰落的原因: 一、经济全球化与贫富差距的加剧1. 自由主义经济政策的局限性 自由主义经济学强调市场自由、私有化、减少政府干预,但其在21世.............
  • 回答
    俄乌战争期间,虚假信息(假消息)的传播确实非常广泛,其背后涉及复杂的国际政治、媒体运作、技术手段和信息战策略。以下从多个角度详细分析这一现象的成因: 1. 信息战的直接动因:大国博弈与战略竞争俄乌战争本质上是俄罗斯与西方国家(尤其是美国、北约)之间的地缘政治冲突,双方在信息领域展开激烈竞争: 俄罗斯.............
  • 回答
    政府与军队之间的关系是一个复杂的政治与军事体系问题,其核心在于权力的合法性和制度性约束。虽然政府本身可能不直接持有武器,但通过法律、组织结构、意识形态和历史传统,政府能够有效指挥拥有武器的军队。以下是详细分析: 一、法律授权与国家主权1. 宪法与法律框架 政府的权力来源于国家宪法或法律。例如.............
  • 回答
    关于“传武就是杀人技”的说法,这一观点在历史、文化和社会语境中存在一定的误解和偏见。以下从历史、文化、现代演变和误解来源等多个角度进行详细分析: 一、历史背景:武术的原始功能与社会角色1. 自卫与生存需求 中国传统武术(传武)的起源与农耕社会、游牧民族的生存环境密切相关。在古代,武术的核心功.............
  • 回答
    关于近代历史人物是否能够“翻案”的问题,需要结合历史背景、人物行为对国家和民族的影响,以及历史评价的客观性进行分析。袁世凯和汪精卫作为中国近代史上的重要人物,其历史评价确实存在复杂性和争议性,但“不能翻案”的结论并非基于单一因素,而是综合历史、政治、道德等多方面考量的结果。以下从历史背景、人物行为、.............
  • 回答
    关于“俄爹”这一称呼,其来源和含义需要从多个角度分析,同时要明确其不尊重的性质,并指出如何正确回应。以下是详细解析和反驳思路: 一、称呼的来源与可能的含义1. 可能的字面拆解 “俄”是“俄罗斯”的拼音首字,而“爹”在中文中通常指父亲,带有亲昵或戏谑的意味。 若将两者结合,可能暗示.............
  • 回答
    民国时期(19121949)虽然仅持续约37年,却涌现出大量在文学、艺术、科学、政治、哲学等领域具有划时代意义的“大师级人物”。这一现象的出现,是多重历史、社会、文化因素共同作用的结果。以下从多个维度进行详细分析: 一、思想解放与文化启蒙的浪潮1. 新文化运动(19151923) 思想解放.............
  • 回答
    航空航天领域在待遇和职业环境上确实存在一定的挑战,但国家在该领域取得的飞速发展,主要源于多方面的国家战略、技术积累和系统性支持。以下从多个维度详细分析这一现象: 一、国家战略与长期投入:推动技术突破的核心动力1. 国家层面的战略目标 航空航天技术往往与国家的科技竞争力、国家安全和国际地位密切.............
  • 回答
    吴京作为中国知名演员、导演,近年来因《战狼2》《英雄联盟》等作品及个人生活引发公众关注,其形象和言论在不同语境下存在争议,导致部分人对其产生负面评价。以下从多个角度详细分析可能的原因: 1. 个人生活与公众形象的冲突 妻子被曝光:2018年,吴京妻子的近照和视频被网友扒出,引发舆论争议。部分人.............
  • 回答
    近年来,全球范围内对乌克兰的支持确实呈现出显著增加的趋势,这一现象涉及多重因素,包括国际局势、地缘政治博弈、信息传播、经济援助、民族主义情绪以及国际社会的集体反应。以下从多个角度详细分析这一现象的成因: 1. 俄乌战争的爆发与国际社会的集体反应 战争的爆发:2022年2月,俄罗斯对乌克兰发动全面入侵.............
  • 回答
    《是大臣》《是首相》等政治剧之所以能在编剧缺乏公务员经历的情况下取得成功,主要源于以下几个关键因素的综合作用: 1. 构建政治剧的底层逻辑:制度与权力的结构性认知 政治体制的系统性研究:编剧可能通过大量研究英国议会制度、政府运作流程、政党政治规则(如议会制、内阁制、党鞭系统等)来构建剧情。例如.............
  • 回答
    关于“剧组中男性可以坐镜头箱而女性不能”的现象,这一说法可能存在误解或过度泛化的倾向。在影视拍摄中,镜头箱(通常指摄影机或固定设备)与演员的性别并无直接关联,但若涉及性别差异的讨论,可能与以下多方面因素相关: 1. 传统性别刻板印象的延续 历史背景:在传统影视文化中,男性常被赋予主导、主动的角.............

本站所有内容均为互联网搜索引擎提供的公开搜索信息,本站不存储任何数据与内容,任何内容与数据均与本站无关,如有需要请联系相关搜索引擎包括但不限于百度google,bing,sogou

© 2025 tinynews.org All Rights Reserved. 百科问答小站 版权所有