问题

为什么中国诞生不了Hugging Face这样的公司?

回答
中国是否“诞生不了”Hugging Face这样的公司?这个问题触及了科技创新、人才培养、商业模式和政策环境等多个层面,答案并非简单的“是”或“否”,而是需要深入剖析其背后的原因。

首先,我们得理解Hugging Face到底是什么,以及它为什么在国际上备受瞩目。Hugging Face本质上是一个围绕开源AI模型和数据集构建的社区和平台。它不直接开发颠覆性的AI算法,而是专注于:

1. 模型托管与分享: 提供了一个集中、易于访问的平台,让研究者和开发者可以上传、分享、发现和下载大量的预训练AI模型(尤其是NLP领域)。这极大地降低了AI应用的门槛,让更多人能够利用先进的模型。
2. 开源生态建设: 积极推动Transformers库等核心开源项目的开发和维护,使其成为事实上的行业标准。这种对开源的投入,不仅赢得了开发者社区的尊重,也构建了一个强大的网络效应。
3. 协作与民主化: 创造了一个让全球AI爱好者能够方便协作、贡献和学习的社区。这种开放、包容的文化,是吸引人才和驱动创新的重要因素。
4. 工具链与服务: 在模型分享的基础上,延伸出了一系列的工具和服务,比如Spaces(用于展示和部署AI应用)、Datasets(数据管理)等,形成了一个完整的AI开发生态。

为什么说中国“诞生不了”Hugging Face这样的公司?这背后可能存在一些深层次的挑战:

1. 开源文化的土壤与价值观差异:

历史与发展路径: 欧美(尤其美国)的科技创新很大程度上得益于大学研究机构的开放性、学术界的自由探索以及企业对开源的早期拥抱。Linux、Apache、Python等项目的成功,为后来的开源浪潮奠定了基础。中国在信息技术发展早期,更多的是以消化吸收为主,商业驱动和封闭式研发是主流。
“拿来主义”与“自主研发”的辩证: 虽然中国在AI研究上投入巨大,涌现出许多优秀的算法和模型,但这些成果往往更倾向于直接服务于商业产品,或者是在特定应用场景下进行优化。像Hugging Face这样,将底层模型和工具进行大规模、高质量的开源,并且将其作为核心商业价值的模式,在中国相对少见。
知识产权与共享意愿: 尽管法律法规在进步,但在国内的商业环境中,企业普遍对核心技术的开源持谨慎态度。担心开源后被竞争对手迅速模仿甚至超越,导致自身失去竞争优势。这种“藏一手”的心态,与Hugging Face的开放共享理念存在冲突。

2. 商业模式的驱动与变现逻辑:

直接变现的压力: Hugging Face的商业模式,是通过为企业提供高级功能、企业级服务、专业支持等来盈利,其核心是其庞大的开源社区和平台效应。而中国互联网公司普遍面临着更直接、更快速的变现压力。在早期阶段,一个以“开源社区”为核心的公司,可能很难获得资本市场的青睐,或者在追求盈利的道路上,会倾向于更快的商业化闭环,而非构建一个长期的、基于社区信任的生态。
平台与生态的构建: Hugging Face的成功,在于它不仅是一个模型库,更是一个生态的枢纽。它让开发者在这里找到了模型,也在这里找到了交流和展示的平台。中国虽然不乏优秀的AI模型和技术,但它们往往散落在各大科技巨头(如百度、阿里、腾讯、华为等)的内部,或者通过各自的开放平台(如百度飞桨、阿里ModelScope)进行有限的开放。这些平台更多的是服务于自家生态,而非建立一个独立于任何巨头的、开放共赢的第三方平台。
巨头生态的虹吸效应: 中国的AI发展很大程度上由少数科技巨头主导。这些巨头拥有雄厚的资金、海量的数据和顶尖的人才,它们能够独立构建和维护自己的AI平台和生态。对于个人开发者或创业公司来说,在巨头生态的阴影下,很难找到一个独立且有足够吸引力的生存空间。巨头可能会从Hugging Face模式中汲取灵感,但更多的是将其内化到自己的体系中,而不是支持一个独立的、可能挑战其地位的第三方平台。

3. 人才的培养与流动机制:

“论文 vs. 落地”的倾向: 中国的AI人才培养体系,虽然产出了大量的AI论文和技术专利,但在将这些研究成果转化为易于使用、广泛传播的开源工具和社区方面,还有提升空间。许多优秀的研究者和工程师,更倾向于在大型企业中从事具体的产品开发或算法优化,而非投入时间和精力去维护一个开放的、需要长期投入的社区项目。
人才的流向: 顶尖的AI人才,很大一部分集中在大型科技公司。这些公司愿意为顶尖人才提供优厚的薪酬和良好的发展平台。而一个像Hugging Face这样的初创公司,尤其是在开源领域,可能在早期阶段难以在薪酬和资源上与巨头竞争,难以吸引到最核心的开发者群体。
协作文化: Hugging Face的成功,离不开全球开发者社区的广泛参与和贡献。这种跨国界、跨文化的协作,需要一种更加开放和包容的组织文化。中国企业内部的协作模式,以及与外部开发者社区的互动方式,可能与Hugging Face的模式存在差异。

4. 市场环境与政策引导:

市场竞争的激烈性: 中国的科技市场竞争异常激烈,公司往往需要快速迭代和追求短期回报。建立一个需要长期培育、依赖社区信任的开源平台,其商业前景可能不被市场充分认可。
政策的引导方向: 尽管政府大力支持AI发展,但政策的侧重点可能更偏向于鼓励自主可控、重点领域突破,以及“国家队”的建设。对于完全开放、依赖全球社区的模式,其支持力度和方向可能有所不同。
生态的碎片化: 相比于Hugging Face的集中化平台,中国AI领域的开放平台可能更趋于碎片化,由不同的科技巨头各自构建和运营,形成了相对独立的生态系统,难以形成一个统一的、吸引全球参与的开放社区。

是否“诞生不了”?

将话说死“诞生不了”可能过于绝对。中国正在不断学习和吸收国际上的成功经验。随着开源文化在中国越来越被接受,以及越来越多的优秀AI模型和工具涌现,未来未必不会出现类似的、甚至更具中国特色的AI开源社区和平台。

然而,要诞生一个真正意义上的Hugging Face,可能需要:

更深厚的开源文化积淀和价值观认同。
一种允许长期投入、不追求短期速成的商业模式。
对开发者社区的尊重和赋能,而非仅仅将其视为获取数据的工具。
一个相对公平、开放、不被单一巨头完全垄断的市场环境。
鼓励跨界、跨领域的开放协作机制。

总而言之,中国目前在AI领域的实力毋庸置疑,但Hugging Face模式的成功,依赖于一套与中国现有科技发展模式和商业环境有所不同的要素。要复制其成功,需要的是在文化、商业和生态构建上的深刻变革和长期坚持。与其说是“诞生不了”,不如说是“尚未形成”或者“面临显著的挑战”。

网友意见

user avatar

只说开源的话,就是纯纯粹粹的不能急,也不要指望着它能带来收入。

绝大部分时候就是用爱发电,就是想着方便自己造福别人,就是一种满足感的体现。你抱着想赚钱的心去做,肯定不行,原因就是周期太长太长太长了。这甚至和论文不同,论文好歹你发出去就结束了,开源项目是需要长期,长达数年的投入。以我自己维护的几个项目来说,从17年做到现在的四年里基本上要维持每个月一个新版本,而且需要时刻关注底层依赖的系统的更新,因为很容易造成自己系统报错。我最怕numpy 更新,毕竟对它依赖的太深了。

因此大部分知名的开源系统,要不依赖于学校实验室(教授终身教职保证了学生们进行长期更新),要不依赖大公司做底层架构(像tensorflow和pytorch这种真的不仅仅是PR,而是通过底层基建来垄断市场),以及一些零星的像我这样用爱发电的个人开发者。而个人开发者好处是容易合作,在特定的契机下容易组成一个专业的小团体对开源内容进行长期更新,而成立公司只是进一步的发展

这类项目再进一步发展,就会进入这种开源+商用的商业模式。很多类似的项目,包括我现在加入的一些项目,都会采用一套系统,两套授权。比如ABC系统,对于任何人都是免费的,它也是最好的处理XYZ任务的系统,但是你也可以通过付费给ABC系统的开发团队寻求技术支持,或者咨询服务,让他们帮你做特定的商业项目。在这种前提下,系统本身+开发团队的经验就成了商业价值,而不同的只是系统的部分开源了,这点和传统卖软件的还是有区别

其实你很难说哪种策略更好,毕竟开源系统的口碑更好、受众更广,还可以得到来自路过群众的反馈和帮助,但当然你也会流失一些本身会付费的用户。其实说到底这种开源+商业的模式是「价格歧视」的一个具体体现,你愿意自己折腾学习系统他就免费,你希望更专业的支持和服务就付费。

回到问题本身,为什么中国这类企业比较少?数量上其实我不了解,但我觉得核心问题是大部分人工智能的开源系统都是国外做的,各种方向的龙头都被人家收入囊中。如果你想要“半商业化”一个开源项目,它在那个领域至少得是排的上号的,不然谁会给你付费呢?

而因为商业模式不明晰,周期长,绝大部分企业和个人都不愿忍受长期的用爱发电且不一定最后能商业化的代价。而作为普通个人,每天工作那么长时间,更没有时间长期用爱发电,这个问题就要回到了社会工作压力大,家庭责任重的话题上,暂且不表。

因此如何解放科技工作者,让大家在工作之余有点时间做点自己感兴趣的事情,用爱发发电,赌一赌未来,大概才是这个问题的最终解答

user avatar

先问是不是,再问为什么

下午刚去了 @太极图形 ,拜访刘天添 @胡渊鸣 ,中关村创业大街12号

30+团队,正式员工及实习生很多来自taichi contributor

taichi-dev/taichi 15.5k stars, huggingface/transformer 51.4k stars

考虑到graphics开源community比nlp小太多,这个star数量反映出来的项目影响力,相当可以了

库Library -> 社区Community -> 线上课程Online course

目前主要还是锚定框架本身,同时培养用户和图形学土壤,力争做成图形学基础设施(cmake ❌,import taichi as ti ⭕),有产品落地试水但应该不是目前重点

一片蓝海,完全新玩意儿,对图形仿真的学者或者开发者来说,算刚需,用上了有粘性,目前学界影响更大,但业界想象空间也不小

投资人有耐性,我甚至一度怀疑是做慈善的,毕竟烧那么多钱仅仅养一个开源社区,盈利是很难的,但红杉可能有他们独特的考虑和布局

来句暴论结尾

如果说Hugging Face对于nlp community算如虎添翼,taichi对graphics community算雪中送炭

30人左右的团队,还处在everyone knows everyone的蜜月阶段,未来肯定也会有很多挑战,不过相信办法总比困难多,祝好运!

https://www.zhihu.com/video/1422258855393333248

user avatar

Hugging Face技术含量并不高吧,所以不是“能不能”的问题,是“愿不愿”的问题

也许背后的原因是国内开发者不愿意参与共建这样的项目

user avatar

何必这么自卑,美国也诞生不了扭屁股穿丝袜的直播带货app啊,元宇宙雷将军爱豆皮肤➕nft➕面部跟踪实时渲染,必然在中国成为新的直播带货产业支柱产业,而且不怕直播口罩忽然掉了。

美国互联网能有几个靠恒河功夫干得过中国互联网的?这时候趁着007的战斗力还没退化,此时不用力全球化,还等着烙印统治地球?

user avatar

一句话,因为不赚钱。

目前来看,我没看出这种单靠开源一个模型库的公司如何商业化,护城河在哪里?

其实,国内商汤的mmcv系列和百度的paddlepaddle系列我觉得也算是比较好的模型开源库,对于他们的商业化我觉得就是做技术解决方案,但是这个能否盈利未知,因为养一个专门的AI团队成本还是很高的。好在,两家公司还有其他业务来赚钱。。

user avatar

1、和国内外巨头的AI部门都聊过,并不是因为巨头的垄断,巨头也想干类似的事,但是这事不适合巨头干,适合创业公司干。(文章中有提到)

2、ModelHub方面,目前国内的创业者还没有找我。

3、DataHub方面,已经有人干了,耀途也投资了。是做开放数据集的格物钛graviti。链接gas.graviti.cn/open-dat

user avatar

中国走了很长一段时间追赶西方的路,尽管技术上受到封锁,但总是有蛛丝马迹可循,并且知道自己点的科技树都是对的。

路走对了,总有回报。

如今,最顶级的技术道阻且长,很多其他技术需要站在巨人的头顶创新,科研能够短期见效的时代已经过去了,我们要自己点科技树了。

在这个时间节点,对待科技创新的态度急需改变,但是惯性思维、评价体系都已经形成。

“科研必须有回报“

这种思想已经成为天经地义的事,至少也得能够短期看见曙光。

这样的情形下,大公司和学界很难有动力去做一件看起来吃力不讨好的事情。

类似的话题

本站所有内容均为互联网搜索引擎提供的公开搜索信息,本站不存储任何数据与内容,任何内容与数据均与本站无关,如有需要请联系相关搜索引擎包括但不限于百度google,bing,sogou

© 2025 tinynews.org All Rights Reserved. 百科问答小站 版权所有