百科问答小站 logo
百科问答小站 font logo



如何看待Sony在ps5上侧重于SSD性能? 第1页

  

user avatar   cocosuma 网友的相关建议: 
      

这块SSD已经被分析得很透彻了,并没有什么特别的“黑科技”,所有东西都是针对游戏机这个场景进行专门适配的结果,理论上来讲,成本并不高,甚至很可能比 Xbox Series X 的 SSD 成本还要低。

没错,两倍多的速度,但是理论上成本还低,为什么?

因为SSD的主控其实很便宜,主要作用是给厂商区分定价,实际上高端主控拿货价格和低端主控并没差几个钱。不过,好马配好鞍,PC上高端SSD往往都要搭配一块不小的DDR缓存用来存放地址查找表(LUT),也就这样了。

如果你想用一堆64GB的闪存来造一块1TB的硬盘,你可以用16个通道,每个通道放一片闪存,这样速度最快,16x64GB=1024GB,然后速度我们姑且可以当作16X.

而PS5就是这样的设计,12个通道,每个通道64GB,12x64=768GB。从1024换算到1000也就是825G了。速度姑且当作12X。

XSX的话就只有4通道,但是每个通道是可以堆叠多颗芯片的,所以就是4x4x64GB=1024GB,但是只有4X的速度。所以如果你看原始速度,5.5GB/s vs 2.4GB/s,大约是2.3倍的差距。为什么不是3倍呢?因为64GB的闪存跑不满单个通道,所以多个芯片堆叠的时候会对通道带宽利用更加完整。

这也是为什么,群联的8通道E16主控就能跑到5GB/s的读取,而PS5的12通道主控只能跑到5.5GB/s。实际上就是单颗闪存对通道带宽利用不完整导致了一定程度的浪费。

当然,还有另一种可能性,就是PS5的主控的 MT/s per channel 值可能更低,换句话说就是主控上每个通道的速度上限更低,不过这样正好省钱……

===================================

PS5 的主控是 DRAM-LESS 的,这点也很关键,因为省钱。

索尼用大型数据块的方式,降低了块地址总量,从而把前面说的LUT表大小从通常的GB级降到了现在的KB级,因此可以装在一块很小的SRAM缓存内,也就省掉了 1GB DRAM 的钱。别小看这 1GB DRAM,零零总总反映到总成本上,差不多能省个十几刀呢。

访存简化来说就是通过地址+偏移量。你在日常生活里使用的地图,上面只会显示XX大厦,不会显示XX楼XX号XX房间,对吧?传统的PC SSD,地址表就相当于是一张精确到XX楼的地图,而PS5的地址表就相当于是一张精确到XX小区的地图。那么很明显,PS5的地图会小得多,也更容易装进口袋里。

那么,剩下的部分就是偏移量。对于普通PC来说就是XX号XX房间,而对PS5来说则是XX大厦XX楼XX号XX房间……不过,这对读取速度的影响并不大。

而写入,你可以当作是消防演习。PC的写入就是“由XX小区XX大厦XX楼”的人统一进行消防演习,而PS5的写入则是“由XX小区”的人统一进行消防演习。换句话说,后者更加劳师动众。不过对游戏机这个场景来说影响也不是很大。

因此PS5这样的设计,不但没有比XSX贵,反而很可能还比XSX的SSD便宜一小节。因为硬盘容量更小,可以少花4颗闪存的钱。4颗64GB闪存可是一笔大钱,要比一颗更高端的SSD主控贵多了……

====================================

至于怎么看待?很简单,索尼的设计目标就是省钱,而不是(比竞争对手更高的)高性能。高性能只是顺道做到的事而已。就像前面所说,你都省了1/4的容量了,成本大头也低了很多,要是还不加点添头,岂不是会被玩家喷死?所以就做了这么个事情,换个通道多点但又其实没贵多少并且压根不是成本大头的主控,仅此而已。

显卡进行页面交换所需的带宽在当前的GDDR6这种带宽等级下,除非是刻意逼迫,否则不可能存在2GB/s以上SSD无法满足的场景。通常的游戏场景下大多数东西都应该是待在显存和内存里,只有极端情况下(例如飞船进行跃迁)才会需要进行海量交换。但就算是海量交换,5.5GB/s的SSD也没法和2.4GB/s的SSD拉开差距,因为整个给游戏使用的内存空间也就才13GB左右,这其中又有大量的会贮存在内存中的东西不需要交换,实际最多也就swap个把GB。总不能你为了用满这5.5GB/s设计一个场景让玩家来回跃迁吧,你是想让玩家触发光敏闪烁癫痫吗((

另外 Virtual Geometry、Virtual Texture这些东西本质上都是图片格式的素材(VG是用图片格式保存的几何模型),有大量非常高效、并且可以直接寻址的压缩算法,这也是为毛PS5和XSX都加了个硬件解压芯片,不但能释放CPU,而且可以实现超低延迟的素材交换。啥意思呢,平常你用WinRAR解压一个包内的1024个小姐姐文件都是用CPU做的,现在用硬件做了不但带宽高而且延迟很低(并且延迟可估计、可预期,这对稳定的帧数很关键!),另外还能顺手直接访问对应的小姐姐,不需要全解压。所以索尼说这对主机游戏开发是革命性的,因为四舍五入这就是游戏御用虚拟内存啊朋友们。可以直接寻址,延迟可以预期,就意味着有脑子的开发者可以在任何时候直接访问所需的几乎任何素材,而且可以把大量的访问提前给做了,很大程度上隐藏了延迟(尽管不是所有)。

=====================================

接下来回答题主的具体问题:

次世代的内存进步很小会否成为一个瓶颈?

会。这个问题在光追场景下会更加明显。光追也好,4K也好,60-120fps也好,降噪也好,哪个不是显存大户?全都是显存带宽毁灭者啊。448GB/s、560GB/s,某种程度上来说已经划下了次世代游戏访存能力的上限。SSD的增益只在于容量,而不是带宽。

我们知道megatexture,虚拟纹理等流送技术可以节约大量内存,但是瓶颈在于硬盘IO,那么ps5高达8-9GB/s的硬盘IO是否能解决这一瓶颈?

这个要看你怎么定义瓶颈。当年的 Mega Texture 的和现在的虚拟纹理串流就是一菜两名,瓶颈可以说是在于硬盘IO,别说是8-9GB/s的硬盘了,哪怕就是1GB/s的硬盘也够了。甚至如果你有块SATA 3的SSD,你在大多数游戏里都压根不会见到加载不了的东西了。因为虚拟纹理串流最大的瓶颈是【随机读写速度】,这也是为什么线性关卡的游戏一般都是随便用虚拟纹理,你也看不出来卡加载。因为线性关卡很少随机读取,而开放世界游戏就不一样了,大量的随机读取会瞬间拖爆整个游戏。另一方面,PC和PS4都是用CPU来解压缩读取,所以大量读取还会拖爆CPU导致帧生成不稳定。

当然上述暴论是针对PC 1440P及以下场景所说。到了4K的话会适当上浮>2倍。不过次世代都是2.4GB/s起步了,又有硬件解压缩,可以说已经在一定成本下完美解决了该问题。

如此高速的SSD能否有助于画面表现的提升,从而弥补对于微软的xsx在浮点性能上15%的不足?

不能,画面表现提升依赖整个数据通路的带宽。表面上看,PS5只是在浮点性能上“低了2TFlops”,但是如果你看本质的话:

  1. 显存带宽少了25%,相差112GB/s,这个数字上来看可比9GB/s吓人多了,当然我也就是吓吓你而已(逃
  2. LDS、L0之类的WGP级缓存少了44%,L2也少了25%,L1不确定但是应该是也少一些(不然XSX会容易喂不饱CU的)。对GPU这种场景来说,缓存的大小远比频率要重要。RTX 2070 Super 是 40个SM,1.77GHz,不还是照样把40个CU,1.9GHz的5700XT吊起来锤(当然,这也只是用来吓吓你的一个比方而已。实际上Turing在同Teraflops下效率相比RDNA1更高的因素蛮多的,其中一个主要的因素就是N卡的数据通路实际上更高效,给每个流处理器配的缓存大小比RDNA1显卡更扎实)。用懒人的话来讲就是,在一定程度内,缓存容量大小的提升带来的性能增益远大于频率提升。因为你同一级的缓存再快,顶多也就是别人的两倍速度吧?但是每次缓外访问带来的时间开销都是正常缓存内访问的十倍以上(
  3. 现在你应该能明白为什么UE5这个Demo,只能跑到1440P 30FPS了吧。因为无论是Nanite还是Lumen,它其实都更吃显存带宽(而不是显存容量)一些,或者说,更吃GPU利用显存的能力一些。

整体来说XSX的从内存到CU的数据通路带宽高太多了(25-50%之间,视具体场景而定),但即使这样我也不认为XSX能4K 60FPS运行UE5这次的Demo。因为这个Demo的本质,是展示“你看我不用好好优化都能做成这么屌的东西”,而不是“你看我这个东西很屌比其他的都屌”。特别是Lumen,Lumen实际上就是SSGI+粗模反射+稀疏体素追踪GI,Lumen的粗模反射和体素追踪部分居然也不是用光追加速硬件来实现,完全搞不懂为什么,不晓得是API没准备好还是Epic有个性,反正DXR是可以加速体素追踪的。总之很迷。省点性能提高点分辨率不好吗(

再比如Nanite用的也不是Mesh Shader,当然这也是可以预期的毕竟PS5莫得这玩意。XSX在优化良好的情况下几何性能远高于2080Ti,而2080Ti用了mesh之后可以实际渲染50M+的三角形而且人家还是>30fps,Nanite在这个demo里说是实际渲染20M左右的三角形而且还是30fps,这就很尴尬了:

2080Ti跑的Mesh Shader,45fps,48M实绘三角形,4K分辨率

要是像UE5 Demo那样降到20M实绘三角形,或是降到1440P,又可以省出很多资源用来进行pixel shading,又可以提高性能了。四舍五入>60fps没问题的(

正如我之前的暴论所言,这又一次侧面证实了PS5不支持Mesh Shader。几何性能依然受限于并行度不够高的Primitive Shader。

所以不要对省钱为主要设计目的的东西抱有太高期望,这样无论是对粉丝还是对厂商都没好处的。。。万一最后真的399,难道不真香吗……


user avatar   OpenGPU 网友的相关建议: 
      

淘宝刷U盘服务欢迎光临




  

相关话题

  为什么 ps5 国行和 xsx 国行销量会差那么多? 
  如何评价 TapTap 独立营屡次有参赛游戏冲上热门榜,这类限时开发挑战真能做出好游戏吗? 
  PS5为什么会实现不了RDNA2的全部特性? 
  如何看待Amazon基于Cryengine开发的新引擎? 
  为什么有些人没玩几个游戏就说机子吃灰? 
  PS5相比于PS4有哪些进步? 
  彩虹六号:围攻热度为什么不如传统fps高(主要指csgo一类)? 
  现在入switch和ps4哪个好? 
  有什么游戏推动了计算机图形学的发展? 
  微软收购动视暴雪,会结束主机战争吗? 

前一个讨论
近代欧洲战场上有哪些骑兵冲垮线列步兵的经典案例呢?
下一个讨论
胡锡进在知乎上只发不看吗?





© 2024-12-22 - tinynew.org. All Rights Reserved.
© 2024-12-22 - tinynew.org. 保留所有权利