打印

[业评] PS3比XB360机能更强劲的证据！

战神-王者之风

小黑屋

帖子: 11
精华: 0
积分: 3775
激骚: 15 度
爱车
主机
相机
手机
注册时间: 2008-12-7

发短消息
加为好友
当前离线

1^# 大中小发表于 2008-12-20 19:14 只看该作者

我分几部分进行对比：

处理能力：
PS3有6（7）个可用SPU，每一个的运行极限可达到3.2Ghz/s(可多线程协力完成任务）
利用分量增殖指令，每个PPU每个时钟周期可以完成两个双精度操作，转化为6.4G浮点运算。
或者利用向量增殖指令，每个时钟周期完成8个单精度操作，转化为25.6G浮点运算。

XBOX有3个最大3.2Ghz/s的核心（同样可以多线程协力完成）

RAM：
每个PS3 SPU有256M的RAM（6 * 256 =1536，大约1.5G)
256 MB GDDR3 RAM 700 MHz
极限圆点运算540亿每秒。

XBOX每个核心有512MB RAM，（512 * 3=1536，同样1.5G)
500MHZ 10MIB内含随机动态存储器，极限圆点运算240亿每秒。

简单的说：
PS3的处理器能力远大于XO360。PS3有更快的GPU意味着更少的纹理消耗。
PS3的物理材质着色更好是因为他的圆点运算太出色。
XBOX有eDRAM使得AA消耗小，Alpha composting带来了开发优势（最好的例子就是
战争机器）
但在极限处理能力和整体机能最大化方面，PS3远胜360。

本帖最近评分记录

朴智妍激骚 +2 精品文章 2008-12-20 22:50
hh123 激骚 +1 不SB,这是cos某些人以前的嘴脸 2008-12-20 19:30
DBTEL 激骚 +1 精品文章 2008-12-20 19:24

TOP

nordics

天外飞仙

帖子: 10638
精华: 0
积分: 12578
激骚: 600 度
爱车
主机
相机
手机
注册时间: 2007-2-12

TGFC 2014新年勋章☆☆☆☆ TGFC 2015新年勋章☆☆☆☆ TGFC 2016新年勋章☆☆☆☆ TGFC 2017新年勋章☆☆☆☆ TGFC 2018新年勋章☆☆☆☆ TGFC 2019新年勋章☆☆☆☆ TGFC 2020年度勋章☆☆☆☆

发短消息
加为好友
当前在线

2^# 大中小发表于 2008-12-20 19:24 只看该作者

SB贴。

TOP

狂风007

天外飞仙

帖子: 12714
精华: 0
积分: 83290
激骚: 494 度
爱车
主机: PS4 PRO
相机: 三星S10+
手机: 三星S10+
注册时间: 2005-12-26

PS区 PS4主机首发纪念奖★ PS区大收藏家奖☆☆☆ PS区索饭认证☆☆ PS区携带达人VITA命☆

发短消息
加为好友
当前离线

3^# 大中小发表于 2008-12-20 19:24 只看该作者

省省吧

好好玩游戏去，说这些没意义

TOP

恨水无痕

混世魔头

帖子: 4337
精华: 2
积分: 23032
激骚: 6029 度
爱车
主机
相机
手机
注册时间: 2007-3-10

TGFC 2015新年勋章☆☆☆☆ TGFC 2016新年勋章☆☆☆☆ TGFC 2017新年勋章☆☆☆☆ TGFC 2018新年勋章☆☆☆☆ TGFC 2019新年勋章☆☆☆☆ TGFC 2020年度勋章☆☆☆☆ 水区达人认证☆☆☆

发短消息
加为好友
当前离线

4^# 大中小发表于 2008-12-20 19:24 只看该作者

吹，继续吹！

TOP

cangying

小黑屋

帖子: 7373
精华: 0
积分: 20961
激骚: 94 度
爱车
主机
相机
手机
注册时间: 2005-10-19

发短消息
加为好友
当前离线

5^# 大中小发表于 2008-12-20 20:02 只看该作者

Xbox 360与PS3机能深度对比分析!!!

首先，ps3的cell要明确是单core就是一个物力核心，外加8个spe的架构，但是有一个spe是做备用，其余七个负责simd（单指令多数据流）运算，这些都是协处理单元不是core，也就是说每个可移植性一个独立线程但不是代表就是多核心架构。pu总共可执行8个线程，物理内核是2个。每个单元有独立的256k缓存，执行的simd是128位的。xb360是3核心smt结构，三个内核封装在一起共享1MB二级缓存，是典型的多核心ON DIE架构，内核，缓存和SMT总线时钟频率一致。从浮点上说CELL要比POWER PC高，但是PS3只有一个VMX单元，而XB360有3个，VMX可以提高数据流的执行效率，尤其是对图形和多媒体做了优化，相当于INTEL的SSE3和AMD的3D NOW!。照IBM的说法VMX可以提高50%的指令执行效能，所以不能单纯认为XB360的115G FLOPS就很差，未必。P4要说浮点够烂的，但是2G FLOPS的P4在处理流媒体上速度比快5倍的G4还快得多，例如处理1080P的视频，道理也在这里，所以个人觉得数据吞吐能力才是衡量关键，服务器上的CPU一般图形工作站也是80%都是FLIPS指标并不是很高的XEON处理器也不是没有道理的。这里我持保留态度，总之不要迷信浮点性能指标。

其次、可以看到PS3的图形子系统的内存仍然是GDDR3,规格都和XB360一样，都只有22G带宽，但是RSX没有ERAM，显存带宽和R500相比
存在超过10倍的差距。其实大家目前用的GPU为什么理论指标超高但是实际游戏性能很差呢？主要问题就出在效率二字上，带宽是很关键的原因，AA,AF高色深的渲染都需要极大的消耗带宽，可是PC上PCIE总线区区4倍于AGP8的可怜带宽怎么能满足数据吞吐的需要？所谓要占用大量显存做桢缓存，可这样仍然不能解决根本问题，显存提供的带宽也不是很高，RSX不也只有22.4G么？但是ERAM的极大带宽可以一劳永逸的解决问题。另外，PS3的红木总线虽然是XDR内存，但是只有16位位宽，XDR是串行内存，提高工作频率才能显著提高带宽，可惜PS3的XDR只有25G带宽，和GDDR比并没有凸现出该有的优势，而且XDR的数据延迟理论上是不大可能低于GDDR的，所以轮内存性能PS3没有优势。而且PS3系统内存和图形系统分开，再过一道总线接口又会有延迟，同样512的内存总量，XB360的可能效能更高。
第三，这张表上在完全不知道R500性能的前提下定论XB360的总体性能1T似乎非常不妥，起码R500怎么看都不会比RSX性能低，为何性能相差一倍？依据在哪里？至少我从一大堆UNKNOWN上看不出来。还有XB360的U接口肯定是存在的，而且视频接口是什么也不知道，没法较，不过应该不会超过PS3的规格。至于存储介质，现在只知道XB360兼容的格式但是不能代表XB360只能支持DVD9，所以所谓红光驱动器也是一种臆断而已。

最后，图形子系统RSX采用FLEX IO，而表上的XB360是南北桥的数据，可是根据POWER PC的架构来判断，XB360根本不会有北桥，所以这个比较没什么意义，FLEX再快也不能和集成在CPU内核的内存控制器相比，而且南桥只关乎通讯性能，磁盘性能，对整体表现影响不大。
音频子系统XB360集成在南桥，光看DTS,杜比之类的没啥比较意义，有没有认证都不知道，而且DOLBY LOGICAL和DOLBY AC-3可不是一码事，PS3是哪个不清楚。至于关乎音频质量最关键的RATF，XB360采用了GREATIVE LABS的OPEN AL2.0技术，CREATIVE现在已经垄断了最先进的各项音频定位技术和算法，而MS本身是音频API接口的制定者，所以我对XB360的音效很放心。综上所述，XB360的最终性能还有待MS自己揭开，目前还不好说，但是我比较看好XB360。

简单说就是cpu浮点性能cell比xb360强90%，但是simd指令ps3是9，而xb360是6，如果是单周期两个simd就是12，xb360反倒还多。加上xb360的vmx单元是3个，所以处理多条数据流未必吃亏，关键要看mips了，可惜没有数据比较，不过我觉得xb处理图形指令可能效能更高，
而且更能应付复杂些的环境。内存性能ps3并不占优势，它的xdr只有3.2g，只能提供25g带宽，几乎和xb360一样，而图形子系统带宽差了一个数量级。如果真的r500是48流水线的统一着色架构，支持wgf1.0或者2.0的话，r500肯定占优，好像rsx的shader指令吞吐量只有100b，而xb360是480（在mydriver看的，他们也是翻译的国外文章），这样的话这部分xb360肯定胜出。音频系统支持的技术标准差不多，因为游戏机本身都不会提供杜比，dts解码，而是靠外部av设备处理，所以应该差不多。但是3d音效就未必了，这方面的造诣nvidia和creative没可比性，后者已经是数字音频基本算法的垄断者，几乎控制了所有的相关技术，而且还有强大的open al技术做支撑，应该xb360不会不如ps3毕竟游戏里面的音效和通常av厂商的那套解决方案不是一个概念也不是一个技术范畴。

总评：cpu性能xb360略逊于cell，但是有的地方占优；gpu xb360基本没有什么悬念，应该占明显优势；音频系统相当但xb360有更大的灵活性，

ps3功能更全；视频系统ps3占优，不过90%的人享用不上hdmi接口；系统总线，图形总线，磁盘内存性能，通讯性能差不多。

~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~

翻译：ＸＢ３６０ＧＰＵ的威力

追溯到2003，ATI和微软宣布了一份开发协议——由ATI来为XBOX的下一代主机开发业界尖端的图形单元。这打破了先前微软和nVidia的合作关系，意味着XBOX下一代主机的图形部分将更换一位新的合伙人。
对于开发360的GPU，ATI面临着怎样的收获和挑战？
Bob Feldstein: 一个挑战就是如何能让它(GPU)在无法升级和扩展的情况下(相对于PC显卡)保持5年的活力。微软向我们提出十分苛刻的设计目标，这迫使我们不能再用对PC显卡市场那套来对付游戏机，是的，我们必须更换思路。我们必须首先考虑到它是专为游戏机设计的，这样便有了如智能内存、统一单元设计、建模影擎这样的设计目标。然后我们的架构小组便以创纪录的速度来实现这些目标。
GPU的细节标是事先由微软完全制订好的，还是他们只是提出了目标、而细节方面由你们来负责？
Bob Feldstein: 微软对GPU提出了一个宽泛的要求。他们特别关心内存带宽和系统整体效能。微软希望图形单元的设计能很好的发挥CPU多核心多线程的优势，而且其设计必须要有能让游戏开发者容易熟悉和易于掌握的架构。微软和ATI一起进行GPU的架构设计，微软制订目标，ATI则来实现它们。例如统一着色器和智能内存，就是这样产生的。

接下来我要问的是，我们从未知晓这个GPU的明确名字，有的叫Xenos，有的叫C1，有时它还被称作R500。传闻ATI避免使用这个代号(R500),是因为那会让360的GPU看上去不如ATI的PC显示芯片——R520。那么，360GPU的名字到底是什么？
Bob Feldstein:360的GPU和PC显示单元没什么关系。我们从未把它叫做R500。C1和Xenos是我们使用过的名字，C1是合同签署前的代号，Xenos则是我们赢得合同后对开发项目的命名——但是C1更加深入人心。当我们一开始将它叫做C1后，这便很难改变了。

有多少工程师投入其设计？
Bob Feldstein:最多时我们对其投入了175位工程师。包括架构设计师、逻辑设计师、电气工程师、验证工程师、测试工程师等。开发小组分散到奥兰多、佛罗里达、马尔伯勒、马萨诸塞等地。开发小组的规模随时改变。
在芯片的起步生产阶段，你们是否帮助过微软？
Bob Feldstein:ATI的确这样做了。这对于微软是很重要的。在这方面微软有个不错的小组来负责，但我们拥有更多的经验，所以很自然的，ATI帮助微软更快的将产品推向市场。
Xenos由两部分组成，主体部分是统一着色器和北桥，子芯片则负责传统意义上单芯片GPU的一些如FSAA(全屏抗锯齿)、alpha(透明处理)、Z Logic(Z轴)部分。
Bob Feldstein:这个和架构没关系。之所以这样做，更多的是考虑到成本的原因。子芯片包含了FSAA、alpha、stencil(模版处理)、Z(轴处理)和一块较大的内存。我们在这片内存中植入了逻辑器件，所以我们将它叫做智能内存。由于这种高速内存的制造废品率较高，分离式的设计有利于我们降低成本(分离的设计如果出现废品，只要报废子芯片即可，而单芯片设计会让整个芯片报废)。我想，在将来，随着制造工艺的进步和成熟，我们可以将两个芯片再整合在一起来节省成本。

人们对数字很感兴趣。Xenos包含多少晶体管？您能否对主芯片和子芯片分别介绍？能否把一些如2-terabit(万亿位)、32GB/sec和22.4GB/sec的带宽作一说明？
Bob Feldstein: 主芯片包含2亿3千5百万晶体管，子芯片有9千万晶体管。智能内存的带宽可以由以下式子算出：
8(2次4格采样)/周期*4(样本)*8(4字节色彩+4字节Z轴)*2(读和写)*500mhz=256 gbytes/sec(也就是2-terabit)。
22.4GB/sec指的是连接主内存的带宽(特别要指出的是，360的512MB主内存是统一的，它可以让开发者更容易对其进行访问)。GPU和CPU的L2 cache也有连接——这个带宽是24GB/sec(强的！)，因为它很重要，所以我们花了不少工夫在这个上面。幸运的是，从一开始就是整个系统一起设计，使我们能得心应手的为其设计惊人的带宽(想想PS3那个半路加上的nVidia图形单元，汗一个~)。

连接系统内存使用128位总线，这是否会成为GPU的瓶颈？为什么在PC显存都使用256位总线的情况下，Xenos还要使用128位？
Bob Feldstein:这个问题问得很好，它正好切中了系统设计的核心。在子芯片上，我们有一块较大容量的内部高速内存。事实上这块高速内存也充当写回式缓存的作用。而且，所有的抗锯齿处理、Z-缓冲和阿尔法混合都在这块内存中进行。这意味着，那些耗带宽的大户(Z,Alpha,FSAA)都是在内部高速内存中进行处理，不需要去访问主内存。这个设计，使得128位的系统内存接口，便足够满足我们的需要，因为内部高速内存为其卸去了很多负担。

让我们来谈谈统一着色器架构。首先我很关心它的效能如何。我相信统一着色架构会为开发者带来很多方便，但这种统一着色管线的设计，是否和现在PC显卡上使用的像素着色与顶点着色分离的设计一样好呢？
Bob Feldstein:统一着色架构能够显著提高整体效能。为什么我这样说呢？让我们先来了解一下什么是统一架构。
现有的分离式着色架构，不同的着色器使用不同的指令集和不同的缓存。我们发现，在实际应用中，无论是像素着色器还是顶点着色器，当一个占据支配权的时候，另一个往往处于闲置状态。为了应付这种情况，传统的方法是设计很多并行管线——虽然在处理像素向顶点转换的过程中它们很多处于闲置状态。
统一着色架构合并了指令集，配备了合适的缓存，任何情况下，它们都可以被无差别的使用。因此，当像素着色占据支配的时候，我们可以让所有48条管线全部处理像素着色。当顶点着色占据支配的时候，我们可以让所有48条管线全部处理顶点着色。当两者都有处理任务时，我们可以根据处理量为它们分配相应数量的着色管线。
统一着色架构是否在硬件和软件级别上都是统一的，还是程序员针对像素着色与顶点着色使用不同的语法编写程序，然后由GPU来对其进行处理，使其应用于统一着色管线？
Bob Feldstein:对于任何着色数据，程序员都可以使用这套指令扩展集。这将把程序员从局限于考虑如何去操作顶点和像素，以及其他任何需要程序员决策的着色数据中解放出来。
当360GPU的细节公之于众之时，nVidia对统一着色架构，特别是对其效能持怀疑态度。您看这是否是因为包括RSX在内的nVidia所有产品，都还未引入统一着色架构的原因(吃不到葡萄说葡萄酸)？
Bob Feldstein:是的。绝对是这样。
在Windows Vista中，无论实际硬件的规格，WGF 2.0会使用统一着色来对待所有GPU。这实际上也就是对将来GPU都使用统一着色架构进行了建议(规定)。ATI通过Xenos GPU的设计，已经掌握了统一着色架构，这是否意味着在将来的一段时间内，ATI在竞争中将占据优势地位？
Bob Feldstein: 我不清楚nVidia将来的计划，但在统一着色的研发上，ATI已经先行了一步。这看上去显然是个优势。

Xenos和PC显卡是否具有可比性？还是由于它们使用不同的着色架构、操作系统、其他系统硬件，让其很难比较？
Bob Feldstein: 比较Xenos和PC显卡的确是很困难。针对不同硬件环境优化的应用程序，会产生不同的结果。我不建议大家去对它们进行比较。游戏机有它的优势，这就是其固定的硬件环境。这使得我们可以充分的利用其硬件机能，比如利用智能内存克服内存带宽瓶颈，以及充分高效地利用所有的48条管线。就算一个硬件上拥有无穷多的着色器，如果没有内存带宽去满足它，那它什么也干不了。
RSX拥有550MHZ的时脉。10%的时脉优势，是否意味着PS3的GPU比Xenos更强大？当然了，我们还是要眼见为实。如果这是真的话，拥有双1080P显示能力的RSX岂不是听上去比Xenos强啊...
Bob Feldstein:不是这样的！这个数字跟系统效能毫无关系。1080P对于理解系统效能毫无用处(SONY真会忽悠)。时脉会对效能产生影响，但很有限。
需要认清的是，内存带宽才是显示系统的瓶颈所在。ATI的智能内存提供了几乎无穷的带宽——这意味着统一着色单元不必为等待数据去闲置着。SONY的处理器将经常面对内存带宽不足的情况，这样时脉的优势将不复存在。
SONY那个双1080P输出和效能根本挂不上钩，但这对市场来说确是个很好的卖点。双头显示的功能，更加表明了RSX是基于PC显卡的设计，只是将PC显卡和游戏机拙劣的拼凑到一起罢了。
当提到Xenos GPU时，经常会提到它拥有超过Shader Model 3.0的特性，按照DirectX来说，应该用个+号。您能给个数字来反映这个Shader Model 3.0+的能力吗？
Bob Feldstein: 在众多另人影响深刻的特征里，其中一个就是，它可以执行1000条指令／程序，提供很高的精度并着色输出。而且，统一着色架构，使得像素着色与顶点着色都可以使用全部的指令集。
微软已经宣布HD-DVD将作为360的外置光驱，我们很想知道，如果Xenos GPU拥有像Radeon X1800的Avivo所包含的那些功能，如H.264、VC-1的硬件加速，微软是用其进行HD解码(硬解压)，还是用３核心的PowerPC处理器来解码(软解压)？
Bob Feldstein:看微软的了。

本帖最近评分记录