CYRIX M2
这个 CPU 是当年的发热大户。
其他的散装 CPU 不涂硅脂还能点亮和玩一小会(半小时~几小时)。
M-II 是连 DOS 都进不了。
当然, 这个回答是很不严谨的, 特别是当您将 M-II 与历史上的电子管 CPU 比较的时候。
如图——
移动端火龙当属高通810。
高通骁龙810(MSM8994,2015)为了对苹果率先推出移动端64位CPU做出回应,高通不得不提前拿出骁龙810,但事实证明芯片这东西赶工必暴死——自动布线和20nm制程让本来就发高烧的A57架构更加雪上加霜。
单核功耗超过5W,四大核功耗由于散热问题至今无人得知,这样的发热量直接让一众厂商在2015全年都没有办法推出像样的旗舰机,间接导致了三星猎户座和海思麒麟的强势崛起,还顺手把索尼、HTC和LG搞了个半死。
顺带一提,在冬天的哈尔滨,早年间的苹果基本通通暴毙,但火龙810不仅可以满血运行,而且自身发热还能维护电池放电。。。
原文地址:
—————2020.4.07更新—————
评论区说X86的HXD提醒了我
280÷64=4.375,不解锁功耗满载时单核才4.4W不到,每个线程不到2.2W……
大家都是龙系处理器,凭什么你就得喷火呢
地狱炎龙你太丢人了,褪裙吧
为什么限定CPU啊,老祖宗eniac的电子管也想来秀一下
要是把范围局限在通用CPU上的话(WSE那种专用处理器不算),那没什么CPU的功耗能和IBM大型机服务器比,巴掌大的CPU算什么?来看看和人头一样大的CPU。
IBM Z196,十年前的产品,45nm工艺制造,每个PU包含四个5.2GHz核心,4*1.5MB L2和24MB L3。
下面图片里的Z196 MCM,集成了20个PU(MCM里其实集成了24个,但是有4个是用来备份的,最多只有20个能工作),一共80个5.2GHz核心,120MB L2、480 MB L3和1920MB L4(每两个PU单元共享192MB),每套功耗1800W。没错,煮饭、炒菜、烧开水无所不能。
Z196最高配置(M80),可以放80个PU(4套MCM),每个book里可以放1套,都位于A Frame机柜里。
后来IBM Z13/14和15的处理器,外观类型都是类似的,都是这样的多芯片MCM结构。
2020.04.02更新
今天来回答几个大家都比较关心的问题,IBM大型机处理器的性能,和同年代x86处理器相比如何?
首先要明确的一点是,诸如Z196这样的处理器,名义上是通用处理器,但实际上它的业务特性是比较明显的,最典型的就是银行和证券公司的交易,每天进出多少金额、买卖多少股票,全部都是非常单纯的数学计算。
更关键的是,我们知道一般的计算机都是指2进制计算机,CPU内部运算时都使用2进制浮点数,但我们日常使用的数字却是10进制。而用2进制去表示10进制浮点数时,其结果只是近似的,而且是不连续的。这一点在金融系统高频次、大数据量的交易当中会导致一些问题,比如误差的累积。
这一点其实反映到了这类CPU的硬件设计上,我先看看下面的微架构图。
拿Z196来说,我们可以明显的看出,这是一个三发射、乱序执行的超标量处理器。
很多朋友可能会认为,三发射?这岂不和奔腾4一样落后?其实不然,因为相比x86,Z系列是更接近于传统CISC的设计,流水线的复杂性比x86要更复杂,所以不能直接比较。
就拿奔腾4来说,3个解码器其实是1+2的配置,也就是1个Complex Decoder和2个Simple Decoder,前者的输出是3个uops,后者是1个uop,也就是理论情况下每周期能输出5个uops。而和Z196同时代的Nehalem(INTEL第一代i系列),则是1+3配置,3个Simple Decoder的输出也是1个uop,而1个Complex Decoder的输出是4个uops,一共是7个uops,INTEL挤了那么多年的牙膏Skylake架构也只是1+4配置,一共8个uops。
回到Z196上,我们可以发现,这货根本没有Simple Decoder,3个都是Complex Decoder,这是之前我说它更接近于CISC的原因。每个解码器都能输出3个uops,一共是9个uops,也就是说理论上它的单周期解码能力其实要比nehalem更强。同时带来的是240字节的超大Instruction buffer,Nehalem上功能类似的Pre-decoder buffer只有16字节。
再来看后端SIMD部分,Z196有3组通用执行端口,对应2组Integer单元、1组Floathing单元,以及2组独立的Load/store单元(就是图中的AGU)。Nehalem同样是是3组通用执行端口,对应1组Integer单元、2组Floathing单元,以及3组Load/store单元。可以看出二者的侧重程度不同,Z系列是更侧重整数运算的,这点也能从80组整数浮点/微代码寄存器和4uops的宽度看出来。
然后我们可以注意到Z196最大的一个不同,在Port 4上还有1组Hex Binary FPU和1组Decimal FPU,这就是IBM的绝活了,这两组浮点单元可以直接在硬件层面进行16进制和10进制运算,直接从根本上解决了2进制到10/16进制转换的精度问题,同时也提高了效率。
之后是缓存和内存部分,这一点其实没什么好比的,Z系列拥有更大的、更多级、更复杂的缓存体系,L1 I-Cache和D-Cache的容量是Nehalem的两倍(其实可以看出,Z196也是一个冯诺依曼/哈弗架构混合体),L2 Cache的宽度比Nehalem大50%,MCM上那恐怖的1920MB L4甚至都可以当内存使。
最后由于Z系列的封闭性(资料太少,大多是操作和使用类的),以及客户的特殊性(都是诸如中国人民银行和四大行之类的金融公司,谁敢在上面跑一把鲁大师?这不是被开除的问题,而是要进监狱的),我没有办法从更高的层面去对比Z196的实际性能,只能到此为止。但大体看来,个人认为Z196微架构比同时期的Nehalem更强。
Z196系列除了80个核心外,它还有一个zBX(zEnterprise BladeCenter Extension)配置,其实就是提供额外的POWER服务器来配合处理数据。最高的112 zBX可以扩展112台双路8核心POWER7刀片服务器,装在4个机柜里,一共是224个处理器1792个核心。
PS:当年IBM基于Z196为12306提交了一套方案,但是最终败给了价格,这个玩意只有金融行业用得起。
本站所有内容均为互联网搜索引擎提供的公开搜索信息,本站不存储任何数据与内容,任何内容与数据均与本站无关,如有需要请联系相关搜索引擎包括但不限于百度,google,bing,sogou 等
© 2025 tinynews.org All Rights Reserved. 百科问答小站 版权所有