太湖之光是江南所制造的,用的处理器是申威(以前叫神威)
神威处理器,是从Alpha衍生出来的。
本来DEC的Alpha是明星处理器,同时代浮点最强。
1998年Compaq收购DEC
2002年,惠普康柏合并,惠普有自己的PA-RISC指令集。
Alpha的东西就卖给中国了。价格不便宜,这是申威的起源。
Alpha当年的思想是很先进的,AMD的K7就有Alpha的影子,英特尔P4的超线程技术是Alpha的
现在被捧成大神的Jim Keller
当年就是在Alpha设计团队中成长的,然后他去了AMD,参与设计了K7,是K8项目的主设计师。
AMD在那几年吊打Intel。
Jim Keller后来去了PA-Semi,这家公司是由Daniel W. Dobberpuhl在2003年创立(老爷子同样是前面提到的Sibyte的创始人),和Jim Keller一样,他也曾在DEC工作,同时他还是Alpha 21064 和StrongARM处理器的主设计者。
就是说,PA-Semi也是Alpha的血脉。
后来PA-Semi给苹果收购,从A5,一直做到今天吊打ARM公版的A13
Jim Keller再去AMD,设计了Zen。
今年Zen2重新吊打一次英特尔,现在Jim Keller在英特尔准备大招。
Alpha当年提出的很多东西都是超前的,EV7总线,超线程,多核心的通信问题。
重金买下Alpha,给神威一个非常好的底子。
江南所拿到Alpha以后,2006年设计出具有自主微结构的申威1,130nm制程工艺的单核心CPU,主频900MHz,集成5700万晶体管。2008年完成的申威2,是一款130nm制程工艺的双核CPU,主频1.4GHz。
这么落后的工艺做到这么高的主频,因为江南所当时和代工厂有深度合作,优化提升主频,实际性能不错。
2010年,申威1600用65nm制程工艺的16核CPU,主频1.1G,双精浮点140G。申威1600被用于神威蓝光超算。
在技术指标上,16核心的神威1600在1.1ghz的时候,双精度浮点运算能力是140.8G,i7 980xe 6核心在3.2ghz,双精度浮点是107.55G。i7的功耗是130W,神威1600的功耗是70W。神威在性能功耗比上已经超越了当时的Intel。而神威的工艺落后,65nm对32nm。
太湖之光用的是申威26010,双精浮点峰值为3.06TFlops,与Kight Landing处在同一水平线。
申威26010采用了“CPU+加速器”的方案(管理核心+运算核心),为64位RISC(主频1.45GHz),拥有260个处理核心和4个内存控制器。处理器内包括四个核心组,每组有65个内核,由8×8 Mesh架构计算集群(CPE)、一个管理单元(MPE)、一个内存控制器(MC)组成。
这个理念属于众核,其实当年alpha21364就考虑过64个核的通信问题,神威有个好底子。
后来众核流行,大家都堆小核心,神威的架构正合适,这个东西做超算是合适的。
还是工艺落后于英特尔两代,做出不低于英特尔的性能。一定功耗内,堆核心数量超过英特尔的超级计算机,性能就是第一。
至于单核心性能,神威用今天的角度看很弱。28nm 2Ghz 大约是2Ghz ARM A75-A76的水平。
所以,不要小看ARM上服务器,生态问题是生态问题,软件不好用是软件不好用。
只看处理器单核性能,不比专门优化的扩展指令集,ARM阵营像苹果A12、A13这种都已经很强大了。
华为做的泰山110,核心号称自己研发(比例存疑),单核心性能比A76还差不少,距离A12、A13很远。华为已经说自己64核打英格尔28核了。
以后ARM扩展扩展高性能指令集,性能很可能非常强大,有一天超算登顶也是可能的。
,