魔头
查看详细资料
TOP
小黑屋
银河飞将
引用: 普通的整数运算程序通常包含大量LOAD/STORE指令和分支,如果没有OOO,在这种情况下,PPE的整数运算表现肯定会远远低于理论值~至于SPE,如果处理那种并行度很高的整型运算,当然也行,但PS3上有这种运算的需求吗?在PS3上,SPE的主要工作,就是做物理运算吧,SPE确实是一个典型的向量单元。仅此而已。
=刀客=飞坦:A+级上忍
引用: cxj3000在上个帖子中说 引用: 普通的整数运算程序通常包含大量LOAD/STORE指令和分支,如果没有OOO,在这种情况下,PPE的整数运算表现肯定会远远低于理论值~至于SPE,如果处理那种并行度很高的整型运算,当然也行,但PS3上有这种运算的需求吗?在PS3上,SPE的主要工作,就是做物理运算吧,SPE确实是一个典型的向量单元。仅此而已。 有大量LOAD/SAVE的代码正好是SPE的强项,那个256k的Local Store + DMA非常有效。访问LS只需要几个CYCLE,而访问内存是要几百个CYCLE的。SPE是一个向量单元,但是不是象楼上说的只做物理运算。这样子讲吧,SPE的向量运算引擎可以看作是一个加强了很多的Pentium里边的SSE或者AMD里边的3DNow。比如说MPEG4解码,象iDCT、MC等等都是PPE的强项,而VLD就难做了,因为里面会有很多分支的指令。
引用: 这贴给我一个感觉~IBM的人都是SB,这么多简单的不能在简单的错误竟然都让Cell给占了~世界第一大科技公司估计还不如TG里头的网友考虑的周全~TG太强了~
引用: 楼上的,乱序执行跟SPE调度没关系的。PPE不支持乱序执行是为了降低PPE的复杂度,将更多的DIE SIZE用在SPE上。不过上面的评测结果很对,双精度是CELL最大的弱点,这个跟当初设计CELL的初衷有关,最开始IBM做CELL的动机很简单,就是给PS3定制芯片。对于游戏来说单精度完全够用,所以CELL的架构是完全为单精度运算优化。不过现在IBM的态度已经转变了,专门成立了部门开发基于CELL的下一代服务器平台,下一代的CELL也已经在开发中,将特别强化双精度运算以运用在科学计算、财经、医疗等领域。
引用: mvmxvx在上个帖子中说 引用: 这贴给我一个感觉~IBM的人都是SB,这么多简单的不能在简单的错误竟然都让Cell给占了~世界第一大科技公司估计还不如TG里头的网友考虑的周全~TG太强了~ 不是IBM的人都是SB,是 s fan 都是sb。ibm 不是神,不可能设计出 一款 像sony 描述的 既可以用在 飞机 大炮,又可以用在 洗衣机冰箱, 还可用在 手机,pda, 还还 可以用在 游戏机, 还还还 可以用在 电视机上。 又能 用好的 cpu。
混世魔头
引用: along在上个帖子中说 引用: 楼上的,乱序执行跟SPE调度没关系的。PPE不支持乱序执行是为了降低PPE的复杂度,将更多的DIE SIZE用在SPE上。不过上面的评测结果很对,双精度是CELL最大的弱点,这个跟当初设计CELL的初衷有关,最开始IBM做CELL的动机很简单,就是给PS3定制芯片。对于游戏来说单精度完全够用,所以CELL的架构是完全为单精度运算优化。不过现在IBM的态度已经转变了,专门成立了部门开发基于CELL的下一代服务器平台,下一代的CELL也已经在开发中,将特别强化双精度运算以运用在科学计算、财经、医疗等领域。 从游戏角度说,浮点性能高低对于以前的主机是比较重要,因为以前很多3D运算都是由CPU承担. 为什么PS3采用CELL,索尼还是玩老一套,希望CPU来完成主要3D运算,没想到MS发布C1规格后索尼发现CELL相对太差了.这才赶紧找NV帮忙,怎奈时间已经不允许了,这才出现改个接口同时阉割版的7600. 所以两界E3的视频效果一天一地.
引用: 计划中的CELL相对并不差PS3原始设计是一个32 SPE的cell做CPU+32SPE做GPU,cell本身也是照这个目标开发的最后 sony发现他们根本不可能完成这个设计,cell即无法达到即定目标又无法放弃不用,于是就出来一个残废cell+客串RSX的残疾怪胎出来
引用: stoneocean在上个帖子中说 引用: 计划中的CELL相对并不差PS3原始设计是一个32 SPE的cell做CPU+32SPE做GPU,cell本身也是照这个目标开发的最后 sony发现他们根本不可能完成这个设计,cell即无法达到即定目标又无法放弃不用,于是就出来一个残废cell+客串RSX的残疾怪胎出来 不是完不成设计,而是当前的制程无法用合适的成本和大小做出来这种东西