白天看到这个消息非常振奋,当即就去找导师汇报!
我:“中国造了一台新超算,100PFlops!”
导师的第一反应是:“功耗多少?”
我:“15MW”
导师:“Holy sh*t!”
我:“他们没用 Intel 的芯片。”
导师:“oh that makes sense”
我也不是黑 Intel,但实在是x86架构的历史包袱太重了,想要实现 性能/功耗比的重大提升,这是一个迈不过去的坎。 我在
如何看待 19 岁少年想做出在目前 Intel 同等计算性能下降低 80% 功耗的全新电路系统芯片? - Sean 的回答这个回答中就提到过,Rex Computing 的人在做的事之一就是砍掉Cache,用 Scratch Pad Memory 取而代之。而在太湖之光的众核架构中的大量 Slave core里面,采用了同样的思路,只保留了instruction cache。data cache用Scratch Pad Memory代替,避免了众核情况下的cache coherence带来的大量性能和功耗浪费。(Master core 里面有正常的Cache),我觉得这是太湖之光实现高性能/功耗比的一个重要原因。 而且Slave core只支持user mode,于是我猜测它在TLB上面应该也有精简。但目前 SW26010 芯片还没有详细的文档资料,所以这点我也只能猜测。
至于采用众核架构,可以说是大势所趋,美帝一些新的系统用的也是Intel的众核Knights Landing芯片,据说性能也很不错。
至于指令集,Jack Dongarra在他的报告里特意强调和Alpha的指令集没有关系,所以哪怕神威前几代芯片和Alpha 有渊源,但这次应该真没有。。
然后更令我惊喜的是不光系统搭起来跑了Linpack,而且还有三项应用入围了Gordon Bell奖的最终名单 (这个算是超算界最厉害的奖了)。充分说明太湖之光已经形成战斗力了啊!
最后冷静下来谈一谈不足之处: HPCG的跑分。为什么HPCG跑分重要?因为它比Linpack更接近真实应用的场景,更能体现出内存系统的瓶颈。用一个汽车的比喻来讲,Linpack的跑分更像是汽车的百米加速指标,而HPCG更像是到真实的赛道上去跑——这时候就不光是加大马力就能行的了,操控性等其他因素也很重要。
太湖之光在HPCG的测试下只达到了它0.3%的峰值性能,总的算下来还不如天河二号。说明其在 memory 和 network 的性能上存在很大的瓶颈。这其实还是挺不乐观的。
最最后还是不要掉以轻心,美帝这边正在奔着exa-scale (1000 Pflops) 努力,计划在2023年拿出性能达到exa-scale,功耗小于20MW 的超算。(美帝目前没有建造类似天河二的系统很大程度上是因为功耗的限制,放眼望去基本都是10MW 以下的) 眼前就有GPU带来的变革,DARPA 为此也投资了不少黑科技的项目, 而且这个新闻一出,估计跟国会要钱更容易了…… 革命尚未成功,同志仍需努力啊!
w作为前HPC从业只能说江南所很强,用落后两代的工艺造出跟英特尔下代众核相当的产品,还比英特尔先投入应用
修改:
看到楼下貌似喷子回复出现,特此针对喷点补充一下:
1)中国无论天河-1还是天河-2现在都是满负荷运转,根本没有闲置问题,天河1不说了,现在用得排队,天河2的国防科大自己想测试下节点都经常没资源,所谓天河-2上利用效率不高也是相对于去目的的,把资源满负荷当然容易,以前跟袁学峰教授合作过,这么说吧,人家所谓利用不充分是说重大科研课题放在天河-2上的没他们期望的比例高,至于金融类动漫类低层次的应用,人家根本没把它们当正经应用(这类应用由于门槛低,并行度高,很容易占用大量计算资源),国防科大和广州天河的袁教授期望的是天河-2在国家重大专项等高层次应用上更多做出贡献,比如核物理,流体力学等代表超算顶尖水平的应用更多(这也是天河-3继续获得国家拨款的主要依据,国家一点都不傻),这当然有一定难度,因为天河-2是异构计算机,想充分利用这些资源,代码几乎都得重写,实际上,在美国TITAN上由于用了GPU, 这类应用推进的也不怎么样。
2)以我在HPC工作接触的情况来看,江南所这个超算完全不用担心上述问题,因为江南所是军方背景,他们搞得计算机一个主要应用就是核物理仿真,中国在核物理仿真方面几乎全部代码都是自主搞得,而且很多代码都是针对江南所的计算硬件专门设计的,编译器加速库等生态系统一应俱全,因此这些在天河-2上遇到的问题,反而在神威上可能不是太大问题,一个例子就是神威超算刚上线,一个核物理仿真在神威上就取得了40P的惊人效率,并且有三个应用已经入围超算应用国际大奖评选了(效率3占到理论峰值多30%的超算应用是惊人的,实际上写过程序的都知道,别说超算,即便多核计算机,一般的应用能达到系统浮点峰值30%都是挺不错了)。
当然相应的,神威上部署民用应用,比如金融/动漫渲染之类低层次应用,反而难度会大一些,基本上代码得重写或者大改,但是对这种层次的超算,这些低水平应用本来就不是重点。
3)有个号称做HPC的从业者在本贴居然吐槽这超算是浪费钱,不如把它拆成工作站给大家?说这话还号称自己搞过超算,是民科超算吗?
对很多核物理和流体,计算电磁学等高端计算来讲,现在超算不是能力太强,是太弱,因此只能千方百计地降低计算复杂度+各种简化,实际上即便是天河-2,做流体的直接数值模拟,也根本达不到可用的尺度,这里居然“超算从业人员”吐槽超算没用不如工作站,他搞的超算应用是“算盘”的算吗?
本站所有内容均为互联网搜索引擎提供的公开搜索信息,本站不存储任何数据与内容,任何内容与数据均与本站无关,如有需要请联系相关搜索引擎包括但不限于百度,google,bing,sogou 等
© 2025 tinynews.org All Rights Reserved. 百科问答小站 版权所有