» 您尚未登录:请 登录 | 注册 | 标签 | 帮助 | 小黑屋 |


发新话题
打印

[业评] PS3比XB360机能更强劲的证据!

我分几部分进行对比:

处理能力:
PS3有6(7)个可用SPU,每一个的运行极限可达到3.2Ghz/s(可多线程协力完成任务)
利用分量增殖指令,每个PPU每个时钟周期可以完成两个双精度操作,转化为6.4G浮点运算。
或者利用向量增殖指令,每个时钟周期完成8个单精度操作,转化为25.6G浮点运算。

XBOX有3个最大3.2Ghz/s的核心(同样可以多线程协力完成)

RAM:
每个PS3 SPU有256M的RAM(6 * 256 =1536,大约1.5G)
256 MB GDDR3 RAM  700 MHz
极限圆点运算540亿每秒。

XBOX每个核心有512MB RAM,(512 * 3=1536,同样1.5G)
500MHZ 10MIB内含随机动态存储器,极限圆点运算240亿每秒。

简单的说:
PS3的处理器能力远大于XO360。PS3有更快的GPU意味着更少的纹理消耗。
PS3的物理材质着色更好是因为他的圆点运算太出色。
XBOX有eDRAM使得AA消耗小,Alpha composting带来了开发优势(最好的例子就是
战争机器)
但在极限处理能力和整体机能最大化方面,PS3远胜360。


本帖最近评分记录
  • 朴智妍 激骚 +2 精品文章 2008-12-20 22:50
  • hh123 激骚 +1 不SB,这是cos某些人以前的嘴脸 2008-12-20 19:30
  • DBTEL 激骚 +1 精品文章 2008-12-20 19:24

TOP

SB贴。



TOP

省省吧

好好玩游戏去,说这些没意义


TOP

吹,继续吹!

TOP

Xbox 360与PS3机能深度对比分析!!!

首先,ps3的cell要明确是单core就是一个物力核心,外加8个spe的架构,但是有一个spe是做备用,其余七个负责simd(单指令多数据流)运算,这些都是协处理单元不是core,也就是说每个可移植性一个独立线程但不是代表就是多核心架构。pu总共可执行8个线程,物理内核是2个。每个单元有独立的256k缓存,执行的simd是128位的。xb360是3核心smt结构,三个内核封装在一起共享1MB二级缓存,是典型的多核心ON DIE架构,内核,缓存和SMT总线时钟频率一致。从浮点上说CELL要比POWER PC高,但是PS3只有一个VMX单元,而XB360有3个,VMX可以提高数据流的执行效率,尤其是对图形和多媒体做了优化,相当于INTEL的SSE3和AMD的3D NOW!。照IBM的说法VMX可以提高50%的指令执行效能,所以不能单纯认为XB360的115G FLOPS就很差,未必。P4要说浮点够烂的,但是2G FLOPS的P4在处理流媒体上速度比快5倍的G4还快得多,例如处理1080P的视频,道理也在这里,所以个人觉得数据吞吐能力才是衡量关键,服务器上的CPU一般图形工作站也是80%都是FLIPS指标并不是很高的XEON处理器也不是没有道理的。这里我持保留态度,总之不要迷信浮点性能指标。

其次、可以看到PS3的图形子系统的内存仍然是GDDR3,规格都和XB360一样,都只有22G带宽,但是RSX没有ERAM,显存带宽和R500相比
存在超过10倍的差距。其实大家目前用的GPU为什么理论指标超高但是实际游戏性能很差呢?主要问题就出在效率二字上,带宽是很关键的原因,AA,AF高色深的渲染都需要极大的消耗带宽,可是PC上PCIE总线区区4倍于AGP8的可怜带宽怎么能满足数据吞吐的需要?所谓要占用大量显存做桢缓存,可这样仍然不能解决根本问题,显存提供的带宽也不是很高,RSX不也只有22.4G么?但是ERAM的极大带宽可以一劳永逸的解决问题。另外,PS3的红木总线虽然是XDR内存,但是只有16位位宽,XDR是串行内存,提高工作频率才能显著提高带宽,可惜PS3的XDR只有25G带宽,和GDDR比并没有凸现出该有的优势,而且XDR的数据延迟理论上是不大可能低于GDDR的,所以轮内存性能PS3没有优势。而且PS3系统内存和图形系统分开,再过一道总线接口又会有延迟,同样512的内存总量,XB360的可能效能更高。
第三,这张表上在完全不知道R500性能的前提下定论XB360的总体性能1T似乎非常不妥,起码R500怎么看都不会比RSX性能低,为何性能相差一倍?依据在哪里?至少我从一大堆UNKNOWN上看不出来。还有XB360的U接口肯定是存在的,而且视频接口是什么也不知道,没法较,不过应该不会超过PS3的规格。至于存储介质,现在只知道XB360兼容的格式但是不能代表XB360只能支持DVD9,所以所谓红光驱动器也是一种臆断而已。

最后,图形子系统RSX采用FLEX IO,而表上的XB360是南北桥的数据,可是根据POWER PC的架构来判断,XB360根本不会有北桥,所以这个比较没什么意义,FLEX再快也不能和集成在CPU内核的内存控制器相比,而且南桥只关乎通讯性能,磁盘性能,对整体表现影响不大。
音频子系统XB360集成在南桥,光看DTS,杜比之类的没啥比较意义,有没有认证都不知道,而且DOLBY LOGICAL和DOLBY AC-3可不是一码事,PS3是哪个不清楚。至于关乎音频质量最关键的RATF,XB360采用了GREATIVE LABS的OPEN AL2.0技术,CREATIVE现在已经垄断了最先进的各项音频定位技术和算法,而MS本身是音频API接口的制定者,所以我对XB360的音效很放心。综上所述,XB360的最终性能还有待MS自己揭开,目前还不好说,但是我比较看好XB360。

简单说就是cpu浮点性能cell比xb360强90%,但是simd指令ps3是9,而xb360是6,如果是单周期两个simd就是12,xb360反倒还多。加上xb360的vmx单元是3个,所以处理多条数据流未必吃亏,关键要看mips了,可惜没有数据比较,不过我觉得xb处理图形指令可能效能更高,
而且更能应付复杂些的环境。内存性能ps3并不占优势,它的xdr只有3.2g,只能提供25g带宽,几乎和xb360一样,而图形子系统带宽差了一个数量级。如果真的r500是48流水线的统一着色架构,支持wgf1.0或者2.0的话,r500肯定占优,好像rsx的shader指令吞吐量只有100b,而xb360是480(在mydriver看的,他们也是翻译的国外文章),这样的话这部分xb360肯定胜出。音频系统支持的技术标准差不多,因为游戏机本身都不会提供杜比,dts解码,而是靠外部av设备处理,所以应该差不多。但是3d音效就未必了,这方面的造诣nvidia和creative没可比性,后者已经是数字音频基本算法的垄断者,几乎控制了所有的相关技术,而且还有强大的open al技术做支撑,应该xb360不会不如ps3毕竟游戏里面的音效和通常av厂商的那套解决方案不是一个概念也不是一个技术范畴。

总评:cpu性能xb360略逊于cell,但是有的地方占优;gpu xb360基本没有什么悬念,应该占明显优势;音频系统相当但xb360有更大的灵活性,

ps3功能更全;视频系统ps3占优,不过90%的人享用不上hdmi接口;系统总线,图形总线,磁盘内存性能,通讯性能差不多。


~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~

翻译:XB360 GPU的威力

追溯到2003,ATI和微软宣布了一份开发协议——由ATI来为XBOX的下一代主机开发业界尖端的图形单元。这打破了先前微软和nVidia的合作关系,意味着XBOX下一代主机的图形部分将更换一位新的合伙人。
对于开发360的GPU,ATI面临着怎样的收获和挑战?
Bob Feldstein: 一个挑战就是如何能让它(GPU)在无法升级和扩展的情况下(相对于PC显卡)保持5年的活力。微软向我们提出十分苛刻的设计目标,这迫使我们不能再用对PC显卡市场那套来对付游戏机,是的,我们必须更换思路。我们必须首先考虑到它是专为游戏机设计的,这样便有了如智能内存、统一单元设计、建模影擎这样的设计目标。然后我们的架构小组便以创纪录的速度来实现这些目标。
GPU的细节标是事先由微软完全制订好的,还是他们只是提出了目标、而细节方面由你们来负责?
Bob Feldstein: 微软对GPU提出了一个宽泛的要求。他们特别关心内存带宽和系统整体效能。微软希望图形单元的设计能很好的发挥CPU多核心多线程的优势,而且其设计必须要有能让游戏开发者容易熟悉和易于掌握的架构。微软和ATI一起进行GPU的架构设计,微软制订目标,ATI则来实现它们。例如统一着色器和智能内存,就是这样产生的。

接下来我要问的是,我们从未知晓这个GPU的明确名字,有的叫Xenos,有的叫C1,有时它还被称作R500。传闻ATI避免使用这个代号(R500),是因为那会让360的GPU看上去不如ATI的PC显示芯片——R520。那么,360GPU的名字到底是什么?
Bob Feldstein:360的GPU和PC显示单元没什么关系。我们从未把它叫做R500。C1和Xenos是我们使用过的名字,C1是合同签署前的代号,Xenos则是我们赢得合同后对开发项目的命名——但是C1更加深入人心。当我们一开始将它叫做C1后,这便很难改变了。

有多少工程师投入其设计?
Bob Feldstein:最多时我们对其投入了175位工程师。包括架构设计师、逻辑设计师、电气工程师、验证工程师、测试工程师等。开发小组分散到奥兰多、佛罗里达、马尔伯勒、马萨诸塞等地。开发小组的规模随时改变。
在芯片的起步生产阶段,你们是否帮助过微软?
Bob Feldstein:ATI的确这样做了。这对于微软是很重要的。在这方面微软有个不错的小组来负责,但我们拥有更多的经验,所以很自然的,ATI帮助微软更快的将产品推向市场。
Xenos由两部分组成,主体部分是统一着色器和北桥,子芯片则负责传统意义上单芯片GPU的一些如FSAA(全屏抗锯齿)、alpha(透明处理)、Z Logic(Z轴)部分。
Bob Feldstein:这个和架构没关系。之所以这样做,更多的是考虑到成本的原因。子芯片包含了FSAA、alpha、stencil(模版处理)、Z(轴处理)和一块较大的内存。我们在这片内存中植入了逻辑器件,所以我们将它叫做智能内存。由于这种高速内存的制造废品率较高,分离式的设计有利于我们降低成本(分离的设计如果出现废品,只要报废子芯片即可,而单芯片设计会让整个芯片报废)。我想,在将来,随着制造工艺的进步和成熟,我们可以将两个芯片再整合在一起来节省成本。

人们对数字很感兴趣。Xenos包含多少晶体管?您能否对主芯片和子芯片分别介绍?能否把一些如2-terabit(万亿位)、32GB/sec和22.4GB/sec的带宽作一说明?
Bob Feldstein: 主芯片包含2亿3千5百万晶体管,子芯片有9千万晶体管。智能内存的带宽可以由以下式子算出:
8(2次4格采样)/周期*4(样本)*8(4字节色彩+4字节Z轴)*2(读和写)*500mhz=256 gbytes/sec(也就是2-terabit)。
22.4GB/sec指的是连接主内存的带宽(特别要指出的是,360的512MB主内存是统一的,它可以让开发者更容易对其进行访问)。GPU和CPU的L2 cache也有连接——这个带宽是24GB/sec(强的!),因为它很重要,所以我们花了不少工夫在这个上面。幸运的是,从一开始就是整个系统一起设计,使我们能得心应手的为其设计惊人的带宽(想想PS3那个半路加上的nVidia图形单元,汗一个~)。


连接系统内存使用128位总线,这是否会成为GPU的瓶颈?为什么在PC显存都使用256位总线的情况下,Xenos还要使用128位?
Bob Feldstein:这个问题问得很好,它正好切中了系统设计的核心。在子芯片上,我们有一块较大容量的内部高速内存。事实上这块高速内存也充当写回式缓存的作用。而且,所有的抗锯齿处理、Z-缓冲和阿尔法混合都在这块内存中进行。这意味着,那些耗带宽的大户(Z,Alpha,FSAA)都是在内部高速内存中进行处理,不需要去访问主内存。这个设计,使得128位的系统内存接口,便足够满足我们的需要,因为内部高速内存为其卸去了很多负担。

让我们来谈谈统一着色器架构。首先我很关心它的效能如何。我相信统一着色架构会为开发者带来很多方便,但这种统一着色管线的设计,是否和现在PC显卡上使用的像素着色与顶点着色分离的设计一样好呢?
Bob Feldstein:统一着色架构能够显著提高整体效能。为什么我这样说呢?让我们先来了解一下什么是统一架构。
现有的分离式着色架构,不同的着色器使用不同的指令集和不同的缓存。我们发现,在实际应用中,无论是像素着色器还是顶点着色器,当一个占据支配权的时候,另一个往往处于闲置状态。为了应付这种情况,传统的方法是设计很多并行管线——虽然在处理像素向顶点转换的过程中它们很多处于闲置状态。
统一着色架构合并了指令集,配备了合适的缓存,任何情况下,它们都可以被无差别的使用。因此,当像素着色占据支配的时候,我们可以让所有48条管线全部处理像素着色。当顶点着色占据支配的时候,我们可以让所有48条管线全部处理顶点着色。当两者都有处理任务时,我们可以根据处理量为它们分配相应数量的着色管线。

统一着色架构是否在硬件和软件级别上都是统一的,还是程序员针对像素着色与顶点着色使用不同的语法编写程序,然后由GPU来对其进行处理,使其应用于统一着色管线?
Bob Feldstein:对于任何着色数据,程序员都可以使用这套指令扩展集。这将把程序员从局限于考虑如何去操作顶点和像素,以及其他任何需要程序员决策的着色数据中解放出来。
当360GPU的细节公之于众之时,nVidia对统一着色架构,特别是对其效能持怀疑态度。您看这是否是因为包括RSX在内的nVidia所有产品,都还未引入统一着色架构的原因(吃不到葡萄说葡萄酸)?
Bob Feldstein:是的。绝对是这样。
在Windows Vista中,无论实际硬件的规格,WGF 2.0会使用统一着色来对待所有GPU。这实际上也就是对将来GPU都使用统一着色架构进行了建议(规定)。ATI通过Xenos GPU的设计,已经掌握了统一着色架构,这是否意味着在将来的一段时间内,ATI在竞争中将占据优势地位?
Bob Feldstein: 我不清楚nVidia将来的计划,但在统一着色的研发上,ATI已经先行了一步。这看上去显然是个优势。

Xenos和PC显卡是否具有可比性?还是由于它们使用不同的着色架构、操作系统、其他系统硬件,让其很难比较?
Bob Feldstein: 比较Xenos和PC显卡的确是很困难。针对不同硬件环境优化的应用程序,会产生不同的结果。我不建议大家去对它们进行比较。游戏机有它的优势,这就是其固定的硬件环境。这使得我们可以充分的利用其硬件机能,比如利用智能内存克服内存带宽瓶颈,以及充分高效地利用所有的48条管线。就算一个硬件上拥有无穷多的着色器,如果没有内存带宽去满足它,那它什么也干不了。
RSX拥有550MHZ的时脉。10%的时脉优势,是否意味着PS3的GPU比Xenos更强大?当然了,我们还是要眼见为实。如果这是真的话,拥有双1080P显示能力的RSX岂不是听上去比Xenos强啊...
Bob Feldstein:不是这样的!这个数字跟系统效能毫无关系。1080P对于理解系统效能毫无用处(SONY真会忽悠)。时脉会对效能产生影响,但很有限。
需要认清的是,内存带宽才是显示系统的瓶颈所在。ATI的智能内存提供了几乎无穷的带宽——这意味着统一着色单元不必为等待数据去闲置着。SONY的处理器将经常面对内存带宽不足的情况,这样时脉的优势将不复存在。
SONY那个双1080P输出和效能根本挂不上钩,但这对市场来说确是个很好的卖点。双头显示的功能,更加表明了RSX是基于PC显卡的设计,只是将PC显卡和游戏机拙劣的拼凑到一起罢了。

当提到Xenos GPU时,经常会提到它拥有超过Shader Model 3.0的特性,按照DirectX来说,应该用个+号。您能给个数字来反映这个Shader Model 3.0+的能力吗?
Bob Feldstein: 在众多另人影响深刻的特征里,其中一个就是,它可以执行1000条指令/程序,提供很高的精度并着色输出。而且,统一着色架构,使得像素着色与顶点着色都可以使用全部的指令集。
微软已经宣布HD-DVD将作为360的外置光驱,我们很想知道,如果Xenos GPU拥有像Radeon X1800的Avivo所包含的那些功能,如H.264、VC-1的硬件加速,微软是用其进行HD解码(硬解压),还是用3核心的PowerPC处理器来解码(软解压)?
Bob Feldstein:看微软的了。
本帖最近评分记录
  • 朴智妍 激骚 -2 白开水帖 2008-12-20 22:50

TOP

还真有认真的....

TOP

不要看广告,要看疗效。数据害死人的。

TOP

放狗搜些乱七八糟的东西,一知半解的下结论~~~~~~或许连一知半解的程度都没有

TOP

嗯......真的很强大..怪不得画面这么差

TOP

这贴索黑的太厉害了吧……

TOP

首页留名。。。

TOP

单纯的比较有意义么??

TOP

好无聊的帖子

TOP

太无聊了,王英和武大比体重有意思吗?

[ 本帖最后由 任黑 于 2008-12-20 22:51 编辑 ]

TOP

根据我的实际使用经验,PS3整体机能确实要比360差一点。

TOP

发新话题
     
官方公众号及微博