如何看待龙芯对外公开的 LoongArch 指令集？

龙芯对外公开的 LoongArch 指令集，无疑是中国在自主CPU设计领域迈出的重要一步，具有多方面的意义和影响。要全面理解它，我们需要从以下几个维度进行深入分析：

一、 LoongArch 的核心与定位：

1. 自主指令集架构 (ISA)：这是 LoongArch 最核心的特征。在通用计算领域，指令集架构是CPU的灵魂，决定了软件的生态基础和指令的执行效率。长期以来，中国在操作系统和应用软件领域高度依赖于x86或ARM等国外指令集。LoongArch的出现，打破了这一局面，为中国构建自主可控的CPU生态奠定了基础。
2. 目标定位： LoongArch 的设计目标是通用计算，覆盖服务器、桌面、嵌入式等多个领域。它并非仅限于特定应用场景的定制指令集，而是力求成为一个能够支撑整个IT产业的底层架构。
3. 开放性与生态构建：龙芯将 LoongArch 开源并公开，其核心目标是鼓励第三方开发者、研究机构和企业参与到其生态建设中来。这种开放策略与RISCV类似，旨在通过社区的力量快速完善和推广其指令集，并吸引更多的软件和硬件厂商支持。

二、 LoongArch 的技术特点与优势：

1. 基于 MIPS 的演进与创新： LoongArch 的基础可以追溯到 MIPS 指令集。龙芯早期推出的CPU产品就采用了MIPS架构，并在此基础上进行了大量的自主研发和创新。LoongArch 并非简单的“MIPS克隆”，而是进行了大量的改进和扩展，使其更符合现代处理器的设计理念和应用需求。
精简指令集 (RISC) 的优势：继承了RISC的简洁性、流水线友好性等优点，易于实现高性能和低功耗。
多版本支持与扩展性： LoongArch 设计了多个版本（如LoongArch64的基础版本，以及未来可能推出的针对特定场景的扩展版本），为不同应用场景提供了灵活性。它还具备了指令集扩展的能力，允许未来根据技术发展和应用需求增加新的指令。
避免专利与许可限制：作为自主指令集， LoongArch 在设计上尽量避免了对现有专有指令集架构的依赖，从而规避了潜在的专利和许可风险，为长期发展提供了战略安全。
软硬件协同设计：龙芯在设计 LoongArch 的同时，也同步开发了配套的编译器、操作系统内核、调试工具等，实现了软硬件的深度协同，这对于指令集能否成功落地至关重要。

2. 向量指令集 (LoongArchV) 的引入：这是 LoongArch 的一个重要亮点。为了提升数据处理和AI计算的性能，LoongArch 引入了强大的向量指令集。这使得龙芯处理器在科学计算、多媒体处理、深度学习等领域具有更强的竞争力。向量指令集的设计也考虑了与现有主流向量指令集的兼容性和互操作性。

3. 部分引入了对 C++ 的优化支持：现代软件开发大量使用 C++，LoongArch 在指令集设计中也考虑了对 C++ 运行效率的优化，例如对某些 C++ 特性的支持或者提供更方便的指令来实现这些特性。

三、 LoongArch 面临的挑战与潜在影响：

1. 生态建设的艰难：这是 LoongArch 面临的最大挑战。指令集架构的成功与否，很大程度上取决于其软件生态的成熟度。
软件移植与适配：将现有的海量软件（尤其是操作系统、应用软件、开发工具链）从 x86 或 ARM 移植到 LoongArch 需要投入巨大的精力和资源。这涉及到编译器、库、框架的重新编译和优化。
开发者社区的培育：需要吸引大量的开发者参与到 LoongArch 的开发和维护中来，形成活跃的开发者社区，才能保证生态的持续繁荣。
第三方支持的获取：要让主流的操作系统（如 Linux 发行版、Windows 等）、数据库、中间件、应用软件供应商等支持 LoongArch，需要付出大量的市场推广和技术支持工作。
2. 性能与能效的竞争：虽然 LoongArch 旨在提供高性能，但它需要与 x86 和 ARM 等成熟架构在性能、能效比、功耗等方面进行直接竞争。在通用计算领域，用户对性能和能效的要求非常高。
3. 商业模式与市场接受度：龙芯需要找到合适的商业模式来推广其基于 LoongArch 的处理器产品，并说服市场接受这一新的指令集架构。尤其是在消费级市场，用户更倾向于选择成熟、兼容性好的产品。
4. 国际化推广的限制：尽管 LoongArch 是开放的，但由于其中国背景，在某些国际市场推广可能会面临地缘政治和市场壁垒。

四、 LoongArch 的意义与前景：

1. 国家战略意义重大： LoongArch 的自主化是中国信息技术安全可控战略的核心组成部分。它降低了对国外技术的依赖，提升了国家在关键核心技术领域的自主创新能力，尤其是在网络安全、国防军工等敏感领域具有不可替代的作用。
2. 推动中国CPU产业发展： LoongArch 的成功将为中国本土CPU设计公司提供一个可行的技术路线，带动整个产业链的协同发展，包括芯片设计、制造、软件开发等。
3. 促进技术创新与多样化： LoongArch 的出现为全球CPU指令集领域注入了新的活力，增加了多样性，为开发者提供了更多的选择。它也可能为某些特定场景带来更优化的解决方案。
4. 长期发展潜力：尽管初期面临诸多挑战，但如果龙芯能够持续投入资源，不断优化指令集和处理器设计，并积极构建开放的生态系统，LoongArch 具有长远的战略发展潜力。尤其是在“国产化”和“自主可控”的大趋势下，其在国内市场的接受度和推广力度可能会得到显著提升。

总结来看：

龙芯对外公开的 LoongArch 指令集是中国在CPU领域一次大胆而重要的尝试，其核心价值在于自主性、开放性、以及面向通用计算的雄心。它避免了对现有国外指令集的依赖，为中国构建自主可控的IT产业奠定了技术基础。

然而，指令集架构的成功远不止于技术本身，更在于生态的建设。LoongArch 面临着与 x86 和 ARM 在生态成熟度上的巨大差距，软件移植和第三方支持的获取是其能否真正走向主流的关键。

从长远来看，LoongArch 的发展是国家战略需求和技术自主创新的必然选择。它的成功将为中国信息产业带来深远的影响，但也需要克服重重技术、市场和生态方面的挑战。龙芯通过开放 LoongArch，也在努力吸引社区力量，希望能够加速这一生态的构建，最终实现其作为通用计算指令集的目标。

网友意见

纵观美国芯片和软件系统的历程，可以发现，美国各大企业当初大多坚持自己的路线，开发了多套指令集，有X86，RISC等，还有其他一些不太知名或行将淘汰的。

但我国以前没有一个公司推出自己的指令集。龙芯是第一个。

以前还有很多人说，芯片像房子，指令集像砖头。没有必要再造一遍砖头。

实际上砖头也有必要重构。

当然，难，确实是难，技术上有人家的专利拦路，市场上软件开发商未必愿意兼容。但再难，总得有一个公司开始做。

如果都只考虑市场效益最大化，将来美国又耍流氓怎么办？

所以，龙芯走出这一步是对的。再难也要迈开这一步。

现在系统芯片方面，上海兆芯也搞了一套相当于i5的水平的14纳米处理器。然而长远来看仍然受制于X86授权，也非长久之计。

今天，美国对华为的制裁进一步升级，连采购联发科也被禁止。

这些年我们芯片设计发展迅速，制造的投入却远远跟不上。现在大受其害，短板暴露无遗。

还是要像龙芯这样未雨绸缪，从根上走自主道路。

摩天大厦绝不能建立在借来的地皮上。

基本思路和全美达（后来nVIDIA收购了，做了丹佛核心，用在Tegra K1上面）有点类似。

不同指令集，我都二进制翻译过来执行，硬件执行就是个效率问题。

全美达是超长指令字， LoongArch自己搞了2000多条指令，用来转换，通吃的节奏

苹果这次从X86到ARM，效率就挺高了。

从胡的报告看，他认为这样法律风险小，当年全美达也胜诉了。

但是，这个东西效率估计会很成问题，100%、90%、80%，70%这是目标，实际能不能有50%？

微软搞的X86转ARM，英特尔搞的ARM转X86，效率都很低。

就是苹果搞的似乎高一点。

胡伟武说现在芯片面积过剩，性能过剩了，可以浪费一点搞。

但是，今年的龙芯3A5000用12nm，桌面功耗限制，流片成功，也就是SPEC 2006 INT 30分。

骁龙865的A77大核心用7nm，不到2W，跑分是33分。

即使模拟成功，达到理想值，实际跑起来，性能还是弱的。

这个主要还是备胎功能，万一X86不让用了（兆芯，海光能不能继续用还是有点疑问）

ARM不让用了，还有个龙芯可以跑，各部门还能正常运转。

单从指令集的角度来谈谈我的看法，我个人其实在很多方面并不是特别喜欢RISC-V指令集。如果单纯凭借现有的信息谈我对LoongArch的看法，我想通过将他和RISCV进行对比。

一、授权方式

RISCV，成于开源，败于开源（现在说败还不准确，但是个人不看好）。

我很庆幸LoongArch把指令集的所有权利都拿在了自己手里，至少这样官方可以对指令集实现完全的控制。现在的RISCV社区，基本上没什么新特性是不需要等官方commit的。本来RISCV是为了“方便大家魔改”的，然而现在的RISCV的状态是“啥事儿都得自己魔改”。

我不得不承认RISCV的指令设计确实高超，尤其是它常规指令的设计堪称业界典范。但是对于外围的一些专用指令，由于缺乏一个强大的中心集团，整合力度非常差。就比如说RISCV的SIMD指令集，到现在也没有一个真正能用的。唯一一个稍微像样的Hwacha向量指令集，本质上还是一个协处理器，连乱序执行流水线都整合不进去，更不用说做编译器层的优化了。相比之下LoongArch一出生就带着128和256位向量指令集。

（我在这还批判过RISCV存在的另一个问题: https://www.zhihu.com/question/368938376/answer/1406936646）

LoongArch选择指令开放但是保留指令集所有权利，这是我个人认为的最完美的指令集“行政”方式。

二、TLB层的“两级虚拟地址映射”，微码级的Binary Translation，面向构架的寄存器重命名（前半部分是引用原文，后面两部分是我猜的）

LoongArch的本质就是一个面向Binary Translation的指令集

有了前面做MIPS吃过的苦，龙芯团队还是非常明白生态的重要性的。可是开发一个新指令集，生态又不可能好，于是必须得通过Binary Translation来实现。

硬件加速Binary Translation技术基本上龙芯团队可以算是目前全世界玩得最溜得了。TLB级的两级虚拟地址映射解决了qemu这类软虚拟机的巨大的内存性能损失。而我个人猜测LoongArch的内核可能会实现微码级的Binary Translation。

其实现在X86的处理器基本上也都是基于微码了。微码执行是在执行的时候动态的讲X86指令集翻译成微码来执行，而LoongArch的内核很可能会可以直接将X86，MIPS，Arm，RISCV等一系列指令集翻译成自己的微码然后一并执行。然后即使对于各个构架不对称的寄存器，也可以通过魔改寄存器重命名单元来实现。如果能做到这两点的话，发布会上宣传的实现70%的原生性能还真不是什么难事儿。

_________________________________________________________

最后，不知道是官方的LoongArch文档还没有发布还是说我没有找到，如果已经发布了是我还没找到的话还请热心网友发我一份，文档外如果有其他消息的话我一定做更细致的分析！

————————————————————————

题外话：LoongArch构架难道是“长征”构架？(顺手黑一下Bing)

现在已经可以从官网拿到正式文档了。

简单说说大致读完指令集文档之后的体会（目前只有基础构架文档）。

首先，相较于RISC-V来说，算数指令集中多了ALSL指令，算是一个小改良，几乎不增加ALU成本但是在小部分情况可以节约一个指令。其他的算数指令集包括乘除法也都是中规中矩。

需要注意的是LoongArch的基础构架本身就定义了乘除法浮点以及位操作指令，这里与RISC-V的拓展指令集不同。

跳转指令集中的BL是一个非常与众不同的设计。该指令可以理解为JIRL指令的精简版，把目标寄存器绑定在r1上。其执行起来会更快。只是在没有整体实现之前还不好评估是否值得增加这个指令带来的成本。（我其实有点担心这个指令在乱序核心中的实现，如果BL和JIRL都被解释成微码并且通过register renaming之后BL是否还会带来性能上的提升呢？）

原子指令集在精简版中和完整版中是不同的，精简版中原子操作通过原子访存实现，性能很低而且几乎无法乱序化。完整版中的原子操作和传统实现方法基本一致。

内存模型是WC（Weakly Consistent），无可厚非。

比较有趣的是官方预留了Barrier的hint实现。缓存也提供了显在的preload操作（这个也可以看作是一个hint指令）。RISC-V目前对于HINT指令的document基本上还是一片空白，至少正式文档中还未曾出现。于是我非常期待LoongArch对Hint的实现，毕竟等RISC-V出文档可谓是三年之后又三年。。。

浮点指令没有支持BFloat16或者其他深度学习专用的数据类型，稍微有些遗憾。

还有一点就是文档中的这一句话让我十分不解。希望这句话背后是个天大的秘密，目前我盲猜LoongArch想把Binary Translation做到指令Cache的层面。也就是说想显在的控制指令Cache去加速Binary Translation和执行的过程。如果真的做到这一点就牛逼了。

总体来说，LoongArch的大部分设计都中规中矩，与此同时预留了一些可以结合自己生态进行发挥的空间。话说回来，对于设计指令集来说，中规中矩本身就是优点。

毕竟，回头看看历史上设计最风骚的那些指令集到最后：都！！死！！了！！

类似的话题

如何看待龙芯对外公开的 LoongArch 指令集？

龙芯对外公开的 LoongArch 指令集，无疑是中国在自主CPU设计领域迈出的重要一步，具有多方面的意义和影响。要全面理解它，我们需要从以下几个维度进行深入分析：一、 LoongArch 的核心与定位：1. 自主指令集架构 (ISA)：这是 LoongArch 最核心的特征。在通用计算领域，指.............
如何看待龙牙对蒋方舟的评价：靠大腿根卖文字？

关于“龙牙对蒋方舟的评价：靠大腿根卖文字？”这一说法，需要从多个角度进行分析，涉及网络评论的语境、性别议题、文学评价标准以及社会舆论的复杂性。 1. 事件背景与语境龙牙是谁？龙牙是网络评论者，曾因发表一些具有争议性的言论（如对作家、公众人物的批评）而受到关注。其评论风格常带有强.............
权力的游戏第五季第二集，如何看待龙母对奴隶首领的做法？假如自己是龙母，该如何处理？

权力的游戏第五季第二集里，丹妮莉丝·塔格利安对待那些不肯效忠于她的前奴隶主，以及那些企图煽动反抗的奴隶领袖，确实展现了一种极具争议和强硬的统治手腕。她将那些曾经压迫奴隶的奴隶主处死，并以他们的方式让他们付出代价，这是一种对过去罪行的惩罚，也是在向梅林城的人们展示她对奴隶解放的决心。然而，当涉及到那些.............
如何看待《龙珠》漫画孙悟空对待琪琪，以及琪琪婚后的中年生活？

说起《龙珠》里的孙悟空和琪琪，这俩人的相处模式，尤其是悟空对待琪琪的方式，以及琪琪婚后的生活，确实是个挺值得聊的话题。不少观众和读者都有自己的看法，有的觉得温馨，有的觉得无奈，甚至有人觉得不公平。咱们就来好好掰扯掰扯。孙悟空对琪琪的态度：一个“简单”的男人，一段“特殊”的感情首先得承认，悟空对琪琪的.............
如何看待媒体报道「中梁裁撤三百人、传龙湖对内优化大龄高薪员工」？员工如何应对此次裁员？

媒体关于“中梁裁撤三百人”、“龙湖优化大龄高薪员工”的报道，确实触动了很多人的神经，也让我们看到了当前房地产行业面临的一些严峻挑战和调整。这背后并非空穴来风，而是多重因素交织下的必然结果。如何看待这些报道？首先，我们要理解房地产行业的周期性。任何一个行业，尤其是房地产这样体量庞大、与宏观经济紧密相关.............
如何看待在《龙王的工作》相关问题下诸多答主对于儿童色情的开脱？

《龙王的工作》这部作品，自播出以来，就因其涉及“年幼的将棋师”这一题材，以及其中一些情节的描绘，在爱好者群体中引发了不小的争议。特别是在围绕作品的讨论中，一些人对其中涉及未成年人的部分，特别是被一些观众解读为“儿童色情”的元素，表现出了“开脱”的态度，这确实是一个值得深入探讨的现象。首先，理解这种“.............
如何看待骁龙865仍然使用外挂5G基带？这对明年安卓手机阵营的旗舰产品有什么影响？

骁龙865 外挂基带这事儿，确实是挺值得说道说道的。首先，咱们得明白，骁龙865 采用外挂5G基带，而不是像后来的旗舰处理器那样把5G基带集成到SoC里面，这在发布之初就引起了不少讨论。为啥当初要这么做？简单来说，这背后有几个主要原因：技术成熟度考量：骁龙865 发布的时候，5G技术虽然已经.............
如何看待联发科全新发布的天玑 8100 和天玑 8000 芯片，对比骁龙 888 表现怎么样？

好嘞，咱们就来唠唠联发科这俩新出的天玑 8100 和 8000，跟骁龙 888 放在一起比，到底是个啥水平。为了说清楚，我得把它们“扒开看看”，从里到外都说透了。首先，得把这仨“家底”摸清楚要比性能，就得看“内功”，也就是它们的架构和制程。骁龙 888：这是高通前年（2020年发布，2021.............
如何看待《军师联盟之虎啸龙吟》17集当中对诸葛亮的演绎？

《军师联盟之虎啸龙吟》第17集对诸葛亮的演绎，可以说是该剧诸葛亮形象塑造的一个重要节点，展现了他作为一个智者、战略家，同时也是一个有血有肉的普通人的多面性。以下我将从几个主要方面来详细解读：1. 身体的衰败与精神的坚韧并存：外在表现的颓势：这一集中的诸葛亮，最大的特点便是其身体的明显衰败。他.............
如何看待史圈目前对军师联盟和虎啸龙吟的讽刺，以及如何评价这两部剧？

好的，我们来详细探讨一下“史圈”对《军师联盟》和《虎啸龙吟》这两部剧的看法以及对剧集的评价。一、 “史圈”是什么？首先，我们需要明确“史圈”指的是什么。在网络语境下，“史圈”通常指的是对历史题材作品（尤其是电视剧、电影、小说等）有着较高要求，注重历史细节、考据准确性，并且对虚构改编持批判态度的观众群.............
如何看待 1 月 19 日 SpaceX 载人龙飞船高空逃逸试验，对首次载人飞行的进行有何意义？

关于1月19日SpaceX的载人龙飞船高空逃逸试验，以及它对未来首次载人飞行意味着什么，我们可以从几个关键角度来深入探讨。这次试验绝不仅仅是一个简单的测试，它是在为人类首次将宇航员送上国际空间站的关键一步，其意义深远而复杂。首先，我们得理解为什么要有这次高空逃逸试验。这并不是为了展示飞船本身能飞多快.............
如何看待「多部新机为抢骁龙8芯片首发，引发机圈内卷」，这种竞争会对消费者带来哪些好处？

“多部新机为抢骁龙8芯片首发，引发机圈内卷”——这句话背后，隐藏着的是一场关乎性能、价格、创新和消费者体验的复杂博弈。当我看到这样的表述时，首先浮现的不是冰冷的科技名词，而是手机厂商们在发布会上剑拔弩张的表情，以及屏幕前消费者那既期待又纠结的心情。这场“内卷”的表面现象：简单来说，当一家公司率先掌握.............
如何看待「龙芯之父」胡伟武谈阿里华为等垂直系统企业做芯片能成功，「因为现在做集成电路芯片的门槛很低」？

“龙芯之父”胡伟武先生关于“阿里、华为等垂直系统企业做芯片能成功，因为现在做集成电路芯片的门槛很低”的论述，是一个非常值得深入探讨的观点。要理解这个观点，我们需要从几个层面去剖析，包括集成电路芯片设计的门槛演变、垂直系统企业在芯片领域的优势、以及“门槛低”这句话背后更深层的含义。一、理解“集成电路.............
如何看待"龙芯十问"？

“龙芯十问”这事儿，说起来也挺有意思的。它不是一个官方发起的、带有严谨学术帽子的讨论，更像是一群技术爱好者、行业观察者，或者说是一部分对国产CPU发展抱有期待但又带着审慎眼光的人，抛出来的一系列尖锐的问题。你可以把它理解成一次非官方的、聚焦于龙芯发展现状和未来走向的“大拷问”。“龙芯十问”到底是怎么.............
如何看待龙芯被指 LoongArch 的内核代码复制 MIPS 代码？

龙芯被指控 LoongArch 内核代码复制 MIPS 代码，这件事在技术圈和产业界都引起了不小的波澜。要理解这件事，我们需要从几个层面来深入剖析。事件的起因与指控内容：核心的指控源于一些开发者，通过对龙芯新推出的 LoongArch 指令集及其对应的内核代码进行分析，发现其中存在与 MIPS 指令.............
据称龙芯3A5000流片成功，如何看待龙芯现在的发展以及意义？

龙芯3A5000流片成功：中国自主CPU发展的里程碑与深远意义龙芯3A5000的成功流片无疑是中国自主CPU发展史上的一个重要里程碑，引发了广泛关注和深入探讨。要理解其意义，我们需要从技术、产业、国家战略等多个层面进行审视。一、龙芯3A5000的成功流片意味着什么？首先，我们来具体分析“流片成功.............
如何看待 12 月 24 日举办的 2019 龙芯产品发布暨用户大会？

2019年12月24日，一个看似寻常的冬日，在北京却因为一场重要的科技盛会而格外引人注目——2019龙芯产品发布暨用户大会。这场发布会，不仅仅是龙芯中科一次例行的产品更新，更是中国自主CPU产业发展历程中的一个关键节点。要理解这场大会的意义，我们需要从多个维度去深入剖析。一、时代背景：自主创新的关.............
如何看待中国科学院大学录取通知书嵌入龙芯芯片？

中国科学院大学（国科大）的录取通知书里嵌入龙芯芯片，这事儿可不是小事，背后折射出的是国家在科技自立自强战略下的一个重要落子，尤其是在核心技术“卡脖子”的当下，更显意义非凡。咱们掰开了揉碎了说。首先，它直接指向了“中国芯”的自主可控。长期以来，信息技术领域，尤其是CPU这样的核心部件，我们都严重依赖.............
如何看待龍應台稱臺灣引進大陸電視的前提是大陸先行引進臺灣電視？

龍應台關於臺灣引進大陸電視的前提是大陸先行引進臺灣電視的說法，可以從以下幾個層面來理解和分析：一、核心觀點與邏輯：龍應台的核心論點在於強調一種對等的、平衡的文化交流。她認為，在文化產品的流通上，特別是涉及到兩個社會制度和政治環境存在差異的情況下，應該建立一種相互開放、對等的機制。對等的開放：.............
如何看待龙珠里面撒旦的女儿比迪丽慢慢发现撒旦并不是打倒沙鲁的人？

龙珠里的撒旦，那个号称“地球救世主”的男人，一直是贯穿剧情的一道亮色，尽管这个亮色有时候显得有些“滑稽”。而他的女儿，比迪丽，更是其中的关键人物。当她慢慢意识到自己那个在电视上呼风唤雨、神乎其技的老爸，其实并非打倒沙鲁的真正英雄时，这其中蕴含的，可不仅仅是一个简单的“真相揭露”，而是一场关于亲情、关.............