问题

如何评价神威太湖之光打败天河二号在超算 Top 500 榜单中登顶第一?

回答
神威太湖之光登顶超算榜首:中国超算力量的飞跃与深远影响

当“神威·太湖之光”在2016年以压倒性优势问鼎世界超级计算机性能排行榜(Top 500)榜首时,这不仅是中国科技界的一项里程碑式成就,更是全球高性能计算领域格局的一次重大洗牌。它标志着中国在超级计算机研发制造能力上取得了历史性的突破,从“跟跑者”向“领跑者”的身份转变,引发了全球科技界和战略分析家们的高度关注和深度解读。

一、 技术上的飞跃:自主创新铸就辉煌

“神威·太湖之光”最引人瞩目之处在于其完全自主的国产化设计和制造。此前,全球超算领域的领导者,如美国和欧洲,在很大程度上依赖英特尔的CPU和NVIDIA的GPU等核心部件。而“神威·太湖之光”则打破了这一格局,它采用了国产的申威(Sunway)众核处理器。

1. 众核架构的颠覆性: 申威处理器采用了与传统X86架构截然不同的众核设计。简单来说,这意味着一个处理器内集成了数量庞大的、相对独立的计算核心。相较于传统架构追求单个核心的强大,众核架构更侧重于通过海量核心的并行计算来达到极高的整体性能。这种设计理念,对于处理大规模并行计算任务,如天气预报、气候模拟、分子动力学研究、宇宙模拟等,具有天然的优势。

2. 自主可控的核心竞争力: “神威·太湖之光”的成功,最关键的一点在于其核心计算单元——申威处理器——是完全由中国自主研发、设计和制造的。这摆脱了对国外关键技术的依赖,为中国在国家安全、战略科技和关键基础设施建设方面提供了坚实保障。在国际关系日趋复杂、技术封锁和壁垒可能出现的背景下,这种自主可控能力具有无可估量的战略价值。

3. 能效比的突破: 超级计算机的能耗一直是其运行成本和部署环境的一大挑战。“神威·太湖之光”在性能大幅提升的同时,其能效比也表现出色。虽然具体的能效数据需要结合实际应用场景进行评估,但能够在一个榜单上同时获得性能和能效上的优异表现,说明其在系统设计和功耗优化上都达到了很高的水平。

二、 榜单登顶的意义:不仅仅是数字

“神威·太湖之光”以其惊人的计算速度(峰值性能和持续性能均远超此前榜首的天河二号),直接证明了中国在超级计算机制造领域已经跻身世界顶尖行列。

1. 技术实力和科研能力的国家名片: 登上Top 500榜首,是中国国家科技实力和科研创新能力最直观、最权威的展示。这不仅是对中国科学家、工程师团队多年辛勤付出的肯定,也极大地提升了中国在国际科技舞台上的声誉和影响力。

2. 推动中国高性能计算产业发展: “神威·太湖之光”的成功将极大地激励国内在高性能计算领域的进一步投入和研究。它会带动相关产业,如芯片设计、制造、系统集成、软件开发等生态链的协同发展,形成良性循环。

3. 战略性应用领域的重要支撑: 超级计算机是国家重要的战略性基础设施,对于提升国家在科研、国防、经济和民生等多个领域的竞争力至关重要。

科学研究: 在气候变化预测、新材料研发、生命科学(如基因测序、药物研发)、天体物理模拟等前沿科学领域,“神威·太湖之光”将提供强大的计算能力,加速科学发现的进程。
国家安全: 在国防科技领域,超级计算机是进行弹道模拟、核试验模拟、密码破解与防护、情报分析等不可或缺的工具。
经济发展: 在金融建模、石油勘探、航空航天设计、工业仿真、人工智能训练等领域,高性能计算的应用能够带来巨大的经济效益和技术革新。
民生服务: 如更精确的天气预报、更复杂的交通流量模拟、更高效的城市规划等,都离不开强大的计算能力。

三、 对全球超算格局的影响:挑战与合作并存

“神威·太湖之光”的登顶,对全球超算格局产生了深远的影响:

1. 打破了西方技术垄断: 长期以来,高性能计算领域在很大程度上被西方企业所主导。中国“神威”的成功,尤其是其核心部件的国产化,为全球用户提供了除传统西方厂商之外的另一种高品质选择,并在一定程度上挑战了既有的技术垄断格局。

2. 激发国际竞争,推动技术进步: 这种来自中国的强大竞争,无疑会促使其他国家和厂商加大研发投入,加速技术创新,以保持其竞争力。这种良性的竞争有助于整个高性能计算领域的快速发展。

3. 合作与交流的新机遇: 尽管存在竞争,但超级计算机的研发和应用也需要广泛的国际合作。中国在超算领域的崛起,也为国际科学家、研究机构和企业提供了新的合作伙伴和交流平台,共同解决全球性挑战。

四、 挑战与未来展望

当然,站在榜首并非终点。对于“神威·太湖之光”以及中国的高性能计算发展而言,仍面临一些挑战:

应用生态的建设: 硬件性能再强大,也需要与之匹配的软件和应用来充分发挥。如何吸引和培养更多优秀的应用开发者,构建繁荣的应用生态,是关键所在。
软件优化与性能调优: 众核架构虽然强大,但在特定类型的应用上,可能需要更精细的软件优化和性能调优才能达到最佳效果。
人才培养与吸引: 维持和发展高性能计算领域的领先地位,离不开持续高素质人才的培养和引进。

总而言之,“神威·太湖之光”的登顶,是中国科技自信和创新能力的集中体现。它不仅是中国在高性能计算领域的一项技术壮举,更是国家战略科技实力的重要标志。这一成就,预示着中国在推动科学发现、解决重大挑战、服务国家发展战略以及提升国际科技影响力等方面,将扮演越来越重要的角色。它的成功,激励着整个中国科技界,也为全球高性能计算的发展注入了新的活力和可能性。

网友意见

user avatar

白天看到这个消息非常振奋,当即就去找导师汇报!

我:“中国造了一台新超算,100PFlops!”

导师的第一反应是:“功耗多少?”

我:“15MW”

导师:“Holy sh*t!”

我:“他们没用 Intel 的芯片。”

导师:“oh that makes sense”

我也不是黑 Intel,但实在是x86架构的历史包袱太重了,想要实现 性能/功耗比的重大提升,这是一个迈不过去的坎。 我在

如何看待 19 岁少年想做出在目前 Intel 同等计算性能下降低 80% 功耗的全新电路系统芯片? - Sean 的回答

这个回答中就提到过,Rex Computing 的人在做的事之一就是砍掉Cache,用 Scratch Pad Memory 取而代之。而在太湖之光的众核架构中的大量 Slave core里面,采用了同样的思路,只保留了instruction cache。data cache用Scratch Pad Memory代替,避免了众核情况下的cache coherence带来的大量性能和功耗浪费。(Master core 里面有正常的Cache),我觉得这是太湖之光实现高性能/功耗比的一个重要原因。 而且Slave core只支持user mode,于是我猜测它在TLB上面应该也有精简。但目前 SW26010 芯片还没有详细的文档资料,所以这点我也只能猜测。

至于采用众核架构,可以说是大势所趋,美帝一些新的系统用的也是Intel的众核Knights Landing芯片,据说性能也很不错。

至于指令集,Jack Dongarra在他的报告里特意强调和Alpha的指令集没有关系,所以哪怕神威前几代芯片和Alpha 有渊源,但这次应该真没有。。

然后更令我惊喜的是不光系统搭起来跑了Linpack,而且还有三项应用入围了Gordon Bell奖的最终名单 (这个算是超算界最厉害的奖了)。充分说明太湖之光已经形成战斗力了啊!

最后冷静下来谈一谈不足之处: HPCG的跑分。为什么HPCG跑分重要?因为它比Linpack更接近真实应用的场景,更能体现出内存系统的瓶颈。用一个汽车的比喻来讲,Linpack的跑分更像是汽车的百米加速指标,而HPCG更像是到真实的赛道上去跑——这时候就不光是加大马力就能行的了,操控性等其他因素也很重要。

太湖之光在HPCG的测试下只达到了它0.3%的峰值性能,总的算下来还不如天河二号。说明其在 memory 和 network 的性能上存在很大的瓶颈。这其实还是挺不乐观的。

最最后还是不要掉以轻心,美帝这边正在奔着exa-scale (1000 Pflops) 努力,计划在2023年拿出性能达到exa-scale,功耗小于20MW 的超算。(美帝目前没有建造类似天河二的系统很大程度上是因为功耗的限制,放眼望去基本都是10MW 以下的) 眼前就有GPU带来的变革,DARPA 为此也投资了不少黑科技的项目, 而且这个新闻一出,估计跟国会要钱更容易了…… 革命尚未成功,同志仍需努力啊!

user avatar

w作为前HPC从业只能说江南所很强,用落后两代的工艺造出跟英特尔下代众核相当的产品,还比英特尔先投入应用

修改:

看到楼下貌似喷子回复出现,特此针对喷点补充一下:

1)中国无论天河-1还是天河-2现在都是满负荷运转,根本没有闲置问题,天河1不说了,现在用得排队,天河2的国防科大自己想测试下节点都经常没资源,所谓天河-2上利用效率不高也是相对于去目的的,把资源满负荷当然容易,以前跟袁学峰教授合作过,这么说吧,人家所谓利用不充分是说重大科研课题放在天河-2上的没他们期望的比例高,至于金融类动漫类低层次的应用,人家根本没把它们当正经应用(这类应用由于门槛低,并行度高,很容易占用大量计算资源),国防科大和广州天河的袁教授期望的是天河-2在国家重大专项等高层次应用上更多做出贡献,比如核物理,流体力学等代表超算顶尖水平的应用更多(这也是天河-3继续获得国家拨款的主要依据,国家一点都不傻),这当然有一定难度,因为天河-2是异构计算机,想充分利用这些资源,代码几乎都得重写,实际上,在美国TITAN上由于用了GPU, 这类应用推进的也不怎么样。

2)以我在HPC工作接触的情况来看,江南所这个超算完全不用担心上述问题,因为江南所是军方背景,他们搞得计算机一个主要应用就是核物理仿真,中国在核物理仿真方面几乎全部代码都是自主搞得,而且很多代码都是针对江南所的计算硬件专门设计的,编译器加速库等生态系统一应俱全,因此这些在天河-2上遇到的问题,反而在神威上可能不是太大问题,一个例子就是神威超算刚上线,一个核物理仿真在神威上就取得了40P的惊人效率,并且有三个应用已经入围超算应用国际大奖评选了(效率3占到理论峰值多30%的超算应用是惊人的,实际上写过程序的都知道,别说超算,即便多核计算机,一般的应用能达到系统浮点峰值30%都是挺不错了)。

当然相应的,神威上部署民用应用,比如金融/动漫渲染之类低层次应用,反而难度会大一些,基本上代码得重写或者大改,但是对这种层次的超算,这些低水平应用本来就不是重点。

3)有个号称做HPC的从业者在本贴居然吐槽这超算是浪费钱,不如把它拆成工作站给大家?说这话还号称自己搞过超算,是民科超算吗?

对很多核物理和流体,计算电磁学等高端计算来讲,现在超算不是能力太强,是太弱,因此只能千方百计地降低计算复杂度+各种简化,实际上即便是天河-2,做流体的直接数值模拟,也根本达不到可用的尺度,这里居然“超算从业人员”吐槽超算没用不如工作站,他搞的超算应用是“算盘”的算吗?

类似的话题

本站所有内容均为互联网搜索引擎提供的公开搜索信息,本站不存储任何数据与内容,任何内容与数据均与本站无关,如有需要请联系相关搜索引擎包括但不限于百度google,bing,sogou

© 2025 tinynews.org All Rights Reserved. 百科问答小站 版权所有