» 您尚未登录:请 登录 | 注册 | 标签 | 帮助 | 小黑屋 |


发新话题
打印

迟来的血洗:你所不知道的PS3(完成版)

本来期待E3能够血洗TG,可惜现状却让我非常的不满意,因此响应TNT兄的号召COS一段时间SF……在此时间里我是作为一名意志坚定的SF而存在~

下面正文开始:

    “微软的确是一个让人敬佩的对手。”加拿大SONY技术研究室的蒙塔崔娜在咖啡室里悠闲地坐着,窗外的阳光柔和地洒在这片空间中,让这位年过40的女技术人员给人一种圣洁的美。

    “因此当他们拿出XBOX360的时候我们的确吃了一惊。”随即她很快地笑道:“不过也就吃了一惊而已,PS3还是按着久多先生的计划逐渐被孵化出来。当时在实验室的我们凝视着这充满我们心血的襁褓,我们相信,即使XBOX360比PS3早出两年,PS3也必定胜利。”
    “因为PS3。”
    “是超越这个世代的。”

    转眼五个月,当时的情形还历历在目。当时蒙塔崔娜女士那淡然而笑的模样使我相信,这就是SONY作为业界霸主所具有的自信。在仔细分析过PS3和XBOX360的整体架构和硬件设计之后,我终于了解到,她那种自信到底是从何而来。

    PS3强大性能的核心——CELL。作为一款革命性的CPU,它在人类历史上的意义堪比RISC1。逆潮流而行的IN-ORDER设计是因为XLC这类强大编译器的出现,这让我们可以从OUT OF ORDER的桎梏中摆脱出来,将更多晶体管放在运算方面。而现在的情况看来,CELL的确是完成了IBM和SONY当初的设计目标,而IBM的全球游戏与互动娱乐总经理Dave Laux先生也从侧面证实了这个事实。

    “CELL技术使PS3具有突破性的表现。这种高效率不仅体现现在可以更快地建模、渲染,更重要的是一个有效的流程设计及相辅的流程实现机制可以保障迭代的影像制作的流程更加顺畅,更能迅速地反映制作人的意图。应用CELL技术后实时渲染将是一个非常平滑的过程,它将帮助游戏开发商得到更好的视觉效果,也同时帮助产品更快地推向市场。”公元2006年8月28日上午11:00,淮海中路的IBM上海分公司里,Dave Laux先生如此对我说道。

    有很多很多人,因为XBOX360拥有3个PPE而CELL只拥有一个而嗤之以鼻。他们认为,正是这个原因CELL只能算是一块浮点协处理器,因为CELL的整数性能是在太差了。而事实是,被耻笑的应该是他们,因为他们不知道SPE其实是块完整的CORE,在Theoretical Peak Operations中我们可以看到,CELL的整数性能和其浮点性能一样强大,其Billion Ops/sec是3.2G的奔腾4的将近5倍。虽然我们知道,出于游戏机的成本控制原因PS3用的CELL是特制版,但在同一个测试中32 bit的整数性能依然能达到3.2G奔腾4的将近4倍。而这一切,都是在CELL还未完全优化的前提下。

    “可是分支预测怎么办?”有人如此问道。不必担心,这是我的回答也是PS3的回答。某些由于嫉妒SONY成功的人认为SPE不具备动态分支预测因此CELL不适合作为游戏CPU,但有一个事实他们必须明白也必须清楚,PS3的SPE具备128个寄存器还有从分支目标预取32条指令的分支预测能力,而且SPE作为一个完整DUAL-ISSUE的核心,在预测失败的时候完全可以切换到另一条指令。况且IBM赋予SPE读取另一个SPE SRAM的能力,在此情况下,SPE SRAM容量过小的担忧完全是杞人忧天。而且另一个事实也是大家必须知道的,当PS3开机的时候每个SPE会分配一个独立的ID,而CELL支持ID的数目是32bit个,因此只有配置了CELL的PS3才是真正的网络革命性的主机!

    看到这里,可能有某些嫉妒PS3性能的人跳出来了:“RSX呢!128bit带宽!整个阉割版7800!”

    可是事实让他们失望了,要知道作为性能最强主机设计的PS3在设计的时候当然会想到这个问题。在这里我们不得不感谢rambus公司,他们为PS3提供的强悍的redwood总线。在redwood总线的支持下RSX的TC性能远远超越PC上的所谓TC,在devstation中我们可以看到,拥有TC的RSX在读取XDR的时候其带宽是20G(IOIF BW),而写入的时候其带宽也可以达到15G(IOIF BW),因此RSX的实际带宽应该是20.8G+20G+15G=55.8G!这远远超越了人们对RSX的理解!

    在这里我们必须回味下CELL的实际性能,在IBM给出的数据中,PC的骄傲——Intel的Clovertown,以扣肉为核心的4核至强服务器处理器其单精度浮点性能是86.4G(2.7G),而PS3的CELL其单精度浮点性能是25G(PPE)+204G(SPE)!这么看来一块SPE的单精度浮点性能比一块2.7G的扣肉核心还要高!而PS3拥有7块SPE!(其中一块做冗余,这是我对SONY唯一不满的地方。)而现在一块不到2G的6300其价格还在一千块以上,可想而知PS3里的CELL的性能!

    “CELL做游戏的AI不行!完全不行!”我似乎预见到嫉妒PS3的人在说什么了,可惜他们这块最后的遮羞布也被技术强大的SONY给揭掉。其实在这里有一个问题是——他们所谓的AI是什么?专家系统还是图形分析系统?如果是专家系统CELL的确不如XBOX360上的XCPU,但我们完全不必为PS3担心!因为在图形分析方面CELL的性能是非常强悍的!在游戏所用的AI中,寻径是最耗费所谓的AI资源,即使是XBOX360的XCPU,也会在这方面耗费相当大的硬件资源。

    可是由于CELL强悍的性能,我们在实现游戏AI方面完全可以用另一种算法——假设游戏里有NPC1和NPC2,在检测NPC2是否在NPC1的视觉中时我们可以以NPC1的视点为中心,在NCP1和NPC2中做条直线,然后用伪色渲染一个视觉窗口,而这个窗口可以检测到NPC2是否在NPC1的视觉中。而这种算法是图形分析系统一类,完全可以发挥CELL强大的性能!而且IBM也曾在几个CELL的实例文件中实现过。

    如果还有人怀疑的话,那么请允许我以H Peter Hofstee的回答作为本文的结尾:

- It is an easy misperception to think of an SPE as a SIMD(vector) only processor. IT IS NOT. Just because we have unified the register file does not mean you have to use SIMD. ( An x86 with SSE or a 970 with VMX is still perfectly ok to use for scalar code and so is the SPE). Compilers support scalar code just fine.
- This SPE implementation has only trivial hardware branch prediction (because large branch prediction structures do not provide a good return on investment in terms of area and power ... better to have more SPEs). Still we do care a lot about idle cycles due to branches, so there is a nice branch hint instruction (architecturally a no-op) that notifies the instruction fetch unit that at address x a branch will end up at address y. Also we support the select instruction that often allows one to eliminate a branch altogether.
- With respect to AI, I don't have the answers, but I have good hope. I think AI is usually not bound by computation but by memory access penalties (on high-frequency processors). I can imagine tree search algorithms for the SPEs that absolutely rock, by getting a lot of memory accesses in flight concurrently. There may be a patent out there by M. Necker and myself that describes some of this for the case of routing table accesses ( also a kind of tree search ).

最后说一句:Only the SONY stand between the Sky and the Earth!PS3难开发完全是开发商的问题~与PS3强大的性能毫无关系~


本帖最近评分记录
  • Jonsoncao 发贴积分 +20 精品文章 2007-7-19 11:40

TOP

这样的文章到现在才出现,是不是晚了些?



TOP

主角通常都是最后出现滴~


TOP

迟来的血洗~~~~

TOP

经典的意义就是经得起时间的沉淀,因此以PS3的性能来看无论何时血洗都不算迟~

TOP

好文章  使我看了更坚定地拥护XO了

TOP

这个当恶搞贴看比较好,好大一颗依星

TOP

俺靠……俺第一次COS SF……大家给点面子好否……

TOP

大概意思好象是CELL>E6700*7
个人感觉应该无可能.

TOP

爱因斯坦是什么,能吃么?

TOP

木人提到爱恩斯坦……而我也木用头像……为啥你知道……

TOP

长文就不看了

TOP

因为此刻我柯南、金田一灵魂附体,看穿了你的阴毛!!

TOP

你这算什么。我还创造出了巴顿2200+这种前无古人后无来者的CPU!!

TOP

引用:
原帖由 aeondxf 于 2007-7-18 23:42 发表
木人提到爱恩斯坦……而我也木用头像……为啥你知道……
爱因斯坦怎么来TG了....

TOP

发新话题
     
官方公众号及微博