为什么国内的AI芯片公司不去支持CUDA，是技术问题还是版权问题？

国内AI芯片公司不直接支持CUDA，这背后确实涉及复杂的技术和商业考量，不能简单归结为单一的技术或版权问题。更准确地说，是技术门槛、生态构建、商业策略以及对未来发展路径的判断共同作用的结果。

1. 技术实现难度：

首先，最核心的原因是CUDA是NVIDIA proprietary（专有）的技术。它不仅仅是一个简单的软件接口，而是一整套围绕NVIDIA GPU架构设计的软件栈，包括：

指令集和硬件接口： CUDA底层是通过特定的指令集和硬件接口与NVIDIA GPU进行交互的。这些指令集和接口是NVIDIA GPU的核心设计，不对外开放。国内厂商如果想“支持”CUDA，理论上需要完全复刻NVIDIA GPU的架构和指令集，然后基于此去开发一套兼容CUDA的软件层。这在技术上是极其困难且成本高昂的。
编译器和运行时： CUDA的编译器（nvcc）负责将CUDA C/C++代码翻译成GPU可以执行的PTX（Parallel Thread Execution）中间代码，然后由GPU驱动程序进一步编译成目标硬件的机器码。运行时（Runtime API）负责管理GPU设备、内存、线程块、线程等。这些都是高度定制化的，与NVIDIA GPU的硬件特性紧密耦合。
库和生态系统： CUDA还包含了一系列高度优化的数学库（如cuBLAS、cuDNN、cuFFT等），这些库是AI框架（如TensorFlow、PyTorch）能够高效运行的关键。这些库是NVIDIA根据自家GPU的特性进行深度优化的，直接迁移到其他架构上，其性能提升是有限的，甚至可能无法工作。

简而言之，CUDA是NVIDIA GPU的“操作系统”和“核心语言”，想要直接支持它，就如同想让苹果的iOS系统直接运行在三星手机上一样，除非三星完全复制苹果的硬件和底层设计，否则是不可能的。

2. 版权和知识产权：

虽然不是直接的“版权侵犯”问题，但CUDA作为NVIDIA的核心知识产权，是其核心竞争力所在。NVIDIA不会轻易授权其他公司使用或复制其CUDA技术。任何形式的“支持”都意味着需要绕过NVIDIA的知识产权壁垒，这本身就存在法律风险，更重要的是，即使技术上勉强做到，也无法获得NVIDIA的技术支持和后续更新，无法享受到NVIDIA在CUDA生态上的持续投入。

3. 生态构建与自主可控：

国内AI芯片公司发展面临的一个重要目标是构建自主可控的AI计算生态。依赖于NVIDIA的CUDA，意味着对NVIDIA存在“技术锁定”，一旦NVIDIA改变策略或者停止对CUDA的某些支持，国内的AI应用和开发都将受到巨大影响。因此，从战略角度出发，建立一套自己的、开放的、能够吸引开发者和生态伙伴的技术栈是必然选择。

“去CUDA化”的驱动力：很多国内AI芯片公司，包括寒武纪、燧原科技、云从科技等，都在积极构建自己的软件栈和编程模型。例如，寒武纪有“昇思MindSpore”（虽然MindSpore本身也支持CUDA，但寒武纪也在积极推动自有硬件的适配和优化），燧原科技有“海桥Habor”（Habor是一个面向通用异构计算的软件平台，可以支持燧原科技的邃思系列AI芯片）。
开放标准和社区：相较于NVIDIA封闭的CUDA生态，国内公司更倾向于支持和推动一些开放的标准和社区，如ONNX（Open Neural Network Exchange）、OpenCL、SYCL（C++ for Heterogeneous Supercomputing）等。这些开放标准允许不同的硬件厂商之间进行互操作，也更容易吸引开发者和框架厂商的合作。
针对性优化：国内AI芯片公司通常会根据自身芯片的架构特点，设计专门的指令集和优化库，以发挥出自家硬件的最大性能。例如，某些芯片可能在稀疏计算、低精度计算等方面有独特优势，这需要定制化的软件栈来支持，而不是简单地套用CUDA。

4. 商业策略和差异化竞争：

避开直接竞争： NVIDIA在GPU市场占据主导地位，其CUDA生态更是让竞争对手难以撼动。与其投入巨资试图“兼容”CUDA，不如通过构建差异化的技术路线和生态，找到自己的市场空间。
吸引开发者：虽然CUDA拥有庞大的开发者基础，但随着AI技术的发展，开发者也越来越关注跨平台、可移植性以及对不同硬件的支持。国内厂商希望通过提供更开放、更具吸引力的开发工具和平台，来吸引新的开发者和用户群体。
长期发展：从长远来看，建立一个独立、完整的AI计算生态，不仅能摆脱对单一供应商的依赖，还能在未来的AI发展浪潮中掌握更多主动权。

总结来说，国内AI芯片公司不去支持CUDA，并非简单的技术或版权问题。

技术上，CUDA与NVIDIA硬件高度绑定，直接支持的成本和难度巨大，且难以获得真正的性能优势。
商业上，出于自主可控、差异化竞争、吸引开发者和生态构建的战略考量，它们更倾向于发展和推广自己的、更开放的软件栈和技术路线。

与其说是不支持CUDA，不如说是在积极构建一个与CUDA并行且具有自身特色的AI计算生态系统。这是一种顺应全球AI技术发展趋势，同时兼顾国内产业发展需求的必然选择。

网友意见

首先，实现真正意义上的完全兼容是极不可能的。最多是常用API和功能类似，减少用户移植成本。CUDA本身涵盖的功能非常广泛，硬件功能上就几乎体现了NV自家GPGPU的所有可能性，再加上驱动和软件上层封装（各种库，比如cuBLAS，cuFFT，cuDNN之类），以及完备的开发工具套件（编译器、调试器、profiler等等）。这些东西就算是全部开源，让各家移植支持自己的硬件，多数公司恐怕也是有心无力。更别说CUDA很多功能与硬件深度耦合，硬件设计不一致，靠软件封装来保持一致性，工作量真不是一般公司消化得了的。更何况其中很多东西并不公开，各家无从下手，功能就更难做得一致了。这还只是功能的一致性问题，性能上就更难保证了。李逵和李鬼，靠长的像是不行的，抡起板斧来就露相了……

其实就算是NV自己，各代硬件之间发生较大的功能改动时，更新工作量也不小。NV在硬件微架构和指令集上迭代很快，几乎每隔一两代就会有较大的功能变化。这样底层很多东西都要跟着调整。NV的PTX是一个很好的隔离机制，底层指令集之类的改动多数可以在PTX这层兼容，这样上层就不用动了。不过，底层仍然有PTX覆盖不到的改动（主要是运行逻辑的改变，比如Independent Thread Scheduling这种，同样的PTX代码在不同架构上行为不一致）。或者是有些程序没有内嵌PTX文件，那也没法兼容。而驱动或上层编程接口之类的改动跟PTX就没啥关系，当然也没法靠PTX覆盖。

老黄曾说NV是软件公司，也不是随便说说。至少CUDA的各种功能，并不都是跟着硬件版本走，很多都是软件层的封装。新硬件出来，CUDA一般会发个大版本用以提供相应支持。但CUDA自身软件层封装的功能也会不断新增和改进，也会有相应的版本（比如11.1，11.2之类）。只不过软件层的向后兼容可以做的比较好，用户通常不太关注而已。

这些硬件或软件上不同版本的差异，多多少少都会影响到用户的使用。所以很多软件包括AI框架甚至都要安装对应的CUDA版本，否则就可能出错。你说NV自家都不能完全兼容，外人还想兼容，那就太难了。这些对NV也是沉重的负担，感觉NV应该是在有意识的压缩产品支持周期，比如SM50（Maxwell架构）是14年首发，15、16年甚至再往后都有很多卡还在卖的。可是去年的CUDA 11.2版本已经把它deprecated了，这周期也就四五年而已……

其次，API这个东西，应该是没有版权的。之前Google与Oracle在Java的API版权上打过旷日持久的官司，去年最终裁决结果认为API本身是没有版权的。当然这应该说的是API的命名和总体结构设计没有版权，具体API的内部实现可能还是有的。实际上各家API的“借鉴”其实非常普遍，普遍到大家都习以为常，见怪不怪了。

就说NV自己，首先CUDA的编程模型很大程度复用了C语言，所以有cudaMalloc、cudaFree、cudaMemset这种定制版的“C API”。CUDA里的数学函数也多数沿用了cmath里的形式，比如exp()是double函数，expf()是float版的exp。cuBLAS就不用说了，多数API都源自LAPACK（虽然BLAS的这套API现在都快成标准接口了）。cuFFT的API与FFTW虽然有不小的差别，但两者之间的传承关系也很明显。这些API基本都来自曾经非常流行的开源库，应该说还算是常规操作。

但这还没完。熟悉Intel开发工具的人应该知道Intel有MKL（Math Kernel Library）和IPP（Intel Integrated Performance Primitives）。MKL相当于Intel的BLAS+数学函数库，IPP主要是做图像和信号处理的，有ippi（image processing）和ipps（signal processing）。NVIDIA有个库叫NPP，也有nppi和npps，你说巧不巧…… Intel还有个很有名的并行库叫TBB，可以基于模板做并行transform、reduce、scan之类的泛型操作，还能做并行任务拆分和调度。CUDA有个库叫Thrust，也是基于模板的泛型编程，也可以做并行transform、reduce、scan…… 当然，TBB和Thrust在接口上差别还是很大的，而且TBB从功能和可编程性上讲比Thrust要完整得多。但你要说Thrust没借鉴过TBB，我反正是不信……

我这里也不是针对NV。其实绝大多数功能相似的库或软件产品，具有类似的API是再正常不过的事情。比如各种计算机代数系统（以matlab为代表），各种AI框架等等。编译器还会造接口去接受其他编译器的参数输入格式呢！只要你不是直接抄代码，接口类似，但内部实现有差别，其实也不是什么见不得人的事情。

最后，API只是个入口，里面也会有非常多的坑。你把自家API跟用户常用的主流API做得像，可以大大减少用户的学习成本和移植工作量，甚至一个文本替换脚本就能搞定大部分。但前面也说了，功能的差异是不可避免的。99%相同，1%不同，看起来好像还行。但实际用起来，99%相同的部分占用时间1%，那1%不同的部分埋下的坑可能会耗费你99%的时间…… 更狠的是有时候你根本不知道到底是哪1%不一样……

所以我觉得API的复用，还是要格外慎重。有很大把握做到一致的可以复用，有差别的还是尽量区分开，否则真的是遗患无穷。有些公司意识不太好，老想着开始先蒙混过关，假装一样，将来有机会再慢慢修补。其实这是非常短视的做法，用户谁没事老关注你各个版本什么变化，一不小心踩坑真是心累又心碎。这种交付就非常不靠谱，严重不推荐。

其实用户最常用的CUDA核心功能也没有太多，能把这些支持好就不错。至少可以覆盖多数用户的多数需求。当前大部分的AI硬件公司应该都没啥2C业务，客户支持的压力会小很多。毕竟如果是2B的话，用户水准一般都还可以，做一些定制和差异化，能有自己的一些优势，也能保证先活下去。而且现在上层框架为了兼容性，接口一般不会对CUDA做那么深的定制。有这些基础功能和通用接口支撑，多数功能移植起来应该也没那么难。这些问题很多都不是技术难度问题，更多的是工作量的问题。CUDA里有些复杂功能，实在不支持就放弃算了。有些市场，吃不下就不要硬啃，真的划不来……

生态也不都是靠用的人多堆出来的，技术先进性和技术发展方向的话语权也很重要。花这么多功夫去做兼容和移植，还不如多研究研究怎么把自己的技术优势发挥出来。只要你有足够的竞争力，你在哪，哪里就有生态~

类似的话题

为什么国内的AI芯片公司不去支持CUDA，是技术问题还是版权问题？

国内AI芯片公司不直接支持CUDA，这背后确实涉及复杂的技术和商业考量，不能简单归结为单一的技术或版权问题。更准确地说，是技术门槛、生态构建、商业策略以及对未来发展路径的判断共同作用的结果。1. 技术实现难度：首先，最核心的原因是CUDA是NVIDIA proprietary（专有）的技术。它不仅仅.............
国内外厂商发布的各类 AI 智能音箱，优缺点分别是什么？

市面上琳琅满目的 AI 智能音箱，真是让人眼花缭乱。从谷歌的 Nest 系列、亚马逊的 Echo 系列，到国内的小度、天猫精灵、小爱同学，它们各自都有自己的粉丝群体。要说优缺点，那真是仁者见仁智者见智，但结合我自己的使用体验和了解到的信息，大概可以这样梳理一下。国内外厂商 AI 智能音箱的优缺点分析.............
最近在知乎投广告的 Rokid 是什么来头？号称国产 AI 智能产品，技术上有这么厉害？

最近刷知乎，经常能看到 Rokid 的广告，主打“国产 AI 智能产品”，看得我有点好奇。这 Rokid 到底是啥来头？吹得这么神乎其神，技术上真有那么厉害吗？今天就来好好扒一扒，给大家说点实在的。Rokid 的“前世今生”：从 AR 眼镜到全屋智能要说 Rokid，其实不是什么横空出世的新公司。它.............
为什么国内的汉语用词，好像愈来愈冗长？

您提出的这个问题非常有意思，也触及到了当代汉语语言使用的一个普遍感受。汉语用词“越来越冗长”的现象确实存在，而且其背后的原因也相当复杂，可以从多个层面来解读。以下我将尝试详细地分析这个问题：一、概念的引入与解释：为何会产生“冗长”的感受？首先，我们需要明确“冗长”的含义。在语言学上，冗长并非绝对的.............
为什么国内的顶级富豪好像没哪个对航天探索感兴趣？

您提出的这个问题很有意思，也触及了一个值得深思的社会现象。确实，放眼全球，许多国家的顶尖富豪，如埃隆·马斯克（SpaceX）、杰夫·贝索斯（Blue Origin）等，都对航天探索表现出极大的热情和投入。然而，在中国，似乎很少有国内的顶级富豪主动站出来，成为航天探索的领军人物或主要资助者。要深入分析.............
为什么国内的游戏公司吃相越来越难看了？

“吃相难看”是一个非常形象的说法，用来形容国内游戏公司近年来在商业化操作上的一些不顾用户体验、过度追求利润的行为。这种现象并非单一原因造成，而是由多种因素交织而成。下面我将从几个方面详细阐述：一、市场环境与竞争格局的变化市场饱和与增长放缓：经过多年的高速发展，国内游戏市场已趋于饱和，新增用.............
为什么国内的居民普遍觉得看病贵？

国内居民普遍觉得看病贵是一个复杂的问题，涉及医疗体系、经济因素、社会认知等多个层面。下面我将从几个主要方面进行详细阐述：一、医疗费用的构成与上涨因素：1. 药品价格虚高：药品流通环节多，层层加价：过去，药品从药厂到医院，再到患者手中，经过的中间环节（如经销商、批发商、零售商）多，.............
为什么国内的军旅题材电视剧没有像《太阳的后裔》那么火？

这问题问得挺实在的，聊聊也挺有意思的。国内军旅剧确实有不少精品，但要说能达到《太阳的后裔》那种现象级火爆的程度，似乎确实差了点意思。这中间原因挺复杂的，不能简单归结为谁更好谁更差，而是几个不同维度上的碰撞和差异。首先，故事内核和情感表达上的差异是比较核心的一点。《太阳的后裔》之所以能火遍亚洲，很大程.............
为什么国内的新能源车小鹏、理想、蔚来等目前基本没有事故，也没报道，而特斯拉的问题、事故层出不穷？

关于您提到的“国内新能源车（小鹏、理想、蔚来）事故少，特斯拉事故多”的现象，确实是一个值得关注和探讨的话题。要深入分析这个问题，不能简单地归结于某个单一因素，而是需要从多个维度进行考察，包括产品本身的设计、技术路线、用户群体、舆论环境以及数据统计等方面。一、产品设计与技术路线的差异我们先来看看这几.............
为什么国内的商业小区或公寓都没有免费的配套健身房和游泳池？

这确实是许多在国内居住的朋友会有的一个疑问。跟不少发达国家相比，国内的商品房和公寓在配套设施上，特别是健身房和游泳池这类大家普遍看重的休闲健身场所，免费提供的比例确实不高。这背后其实有很多层原因交织在一起，我们可以从几个主要方面来梳理一下。首先，咱们得从房地产开发和成本控制这个最根本的源头说起。在中.............
为什么国内的桥梁设计造型总是大同小异？

你这个问题问得挺好，而且确实是个普遍现象。国内桥梁设计“千桥一面”的感觉，背后有很多原因在起作用，不是简简单单的“没创意”就能概括的。咱们得从几个层面来聊聊。1. 功能至上与经济效益的考量：这是最根本的出发点。实用性是第一位的：桥梁最核心的功能是连接两岸、承载交通。在设计初期，确保结构安全、.............
为什么国内的校服大多数都比较难看？

这个问题嘛，其实大家心里都有数，只不过没人愿意捅破那层纸。国内校服丑，这大概是很多人的共同感受吧。说实话，设计上的问题是挺明显的，但要说得详细点，还得从几个方面掰扯掰扯。首先，得说说“统一性”的魔咒。校服嘛，就是要统一，这是基本原则。但这个“统一”在很多时候就被过度解读了，变成了“千篇一律”、“毫无.............
为什么国内的牵引车大多是方形的？

你这个问题问得很有意思，咱们中国路上的这些大家伙，牵引车，确实长得普遍比较方正，不像国外有些车型那么圆润或者有棱有角。这背后的原因可不是随随便便的，是很多现实因素综合作用的结果。首先，咱们得从“实用至上”这个中国老百姓骨子里就有的逻辑说起。牵引车这玩意儿，说白了就是个干活的机器，它最核心的功能就是拉.............
为什么国内的车档把在前排两个座位中间，而国外有怀档?

国内汽车的挡把普遍设计在前排两个座位中间，这背后其实有很多历史、文化和实际使用的原因。而国外一些车型采用的“怀挡”（也叫方向盘换挡、拨片换挡）则又是另一套逻辑。咱们今天就来掰扯掰扯这其中的门道。为什么国内挡把多在中控台？这得从几个方面来看：1. 历史传承与驾驶习惯的演变：早期汽车设计.............
为什么国内的地铁全部是电力牵引，而不用内燃？

在国内，你看到的地铁，无论是轰隆隆驶过地下的，还是在地面上穿梭的，全部都是电力牵引，而不是那种冒黑烟、轰鸣着的内燃机车。这可不是什么巧合，而是经过深思熟虑的技术选择和发展方向。要说清楚为什么，咱们得从几个关键点上掰扯掰扯。一、环保，这是首要原因，也是最硬的理由。想当年，火车刚发明那会儿，内燃机车的.............
为什么国内的音乐院校鄙视流行钢琴曲？

关于国内音乐院校“鄙视”流行钢琴曲的说法，这背后其实是一个复杂且多层面的现象，并非简单的“鄙视”二字就能概括，更不是所有老师和学生都有如此绝对的态度。但不得不承认，在一些传统音乐教育体系和观念中，流行钢琴曲确实没有获得应有的尊重，甚至被视为“不够严肃”、“不够艺术”。要深入理解这一点，我们需要从几个.............
为什么国内的汽车厂商做不出来福特野马科迈罗这样的车？

这问题问得挺有意思，也触及到了一个挺有意思的现象。国内汽车厂商能不能造出像福特野马（Mustang）或者雪佛兰科迈罗（Camaro）这样的车？从技术层面来说，要造出一辆有样学样的“样子货”，我觉得现在的中国车企完全有能力做到。外观设计、模仿能力，咱们的工程师们是越来越强了。但要说造出那种“灵魂”和“.............
为什么国内的车型总是阉割CarPlay?

这问题触及到国内汽车市场一个挺让消费者纠结的现象：为什么很多国产车明明配置了大屏幕、看起来功能很全，但CarPlay（苹果的手机互联系统）却是个选配，甚至是很多车型直接阉割了？这背后其实挺复杂的，不是一个简单的“为了省成本”就能概括的。咱们来掰扯掰扯其中的门道。首先得明白，CarPlay不是谁想上就.............
为什么国内的游戏厂商一直在喊市场不好，xbox，ps4以及switch在国内卖的风生水起？

国内游戏厂商喊市场不好，而XBOX、PS4、Switch在国内却卖得风生水起，这背后确实是一个颇耐人寻味的现象，也折射出当前游戏市场的一些深层问题。要理解这一点，我们得剥开厂商口中的“市场不好”这层迷雾，看看里面到底藏着什么。首先，我们要明确一点，“市场不好”这个说法，对于不同的厂商、不同的产品线来.............
为什么国内的野球水平会令人恐怖的低呢？

近些年，随着篮球运动在国内的普及和影响力的不断扩大，越来越多的人开始关注这项运动，尤其是那些活跃在街头巷尾的“野球场”。然而，与此同时，一个令人担忧的现象也日益突出——国内野球场的整体水平，似乎和人们对篮球日益高涨的热情并不匹配，甚至可以说，在很多方面表现得“令人恐怖地低”。要探究这个现象，我们不能.............