» 您尚未登录:请 登录 | 注册 | 标签 | 帮助 | 小黑屋 |


发新话题
打印

wii和xbox初代,哪个机能更强?

引用:
原帖由 samusialan 于 2021-6-22 13:49 发表
gc功能指标优势应该是2个吧(对比xbox)
1是顶点光源下多边形是同代最多的,但逐像素光源下多边形只比dc强不如另外两
2是单周期8纹理拾取,然后才是基于这个的8光源干涉,不过其实真正实用上效率应该也不会比xbox( ...
XBOX是单周期8次纹理操作。因为它是单周期2 stage@4条像素管线,同样,XBOX可以单周期16次dp3,GC没有原生dp3(也就是法线贴图的基础功能),其余指令也只有单周期4次。纹理操作也是单周期4次。速度上要远远低于XBOX,但是XBOX带宽低有瓶颈。
你说的GC的8次纹理,指的是可以单pass里包含8次纹理操作,XBOX是单pass4次纹理指令。这属于功能方面而非性能方面,而且GC的dependent texture fetch功能(也就是在像素处理过程中改变uv再sample texture的功能),比XBOX要灵活。
但GC的顶点处理性能既不理想,灵活性也差,什么顶点光源下同代多边形最多,基本是扯。


本帖最近评分记录

TOP

引用:
原帖由 samusialan 于 2021-6-22 14:22 发表
感谢详解
关于顶点的问题,我看的文章个人理解大体意思是gc那套t&l正是因为灵活性差,反过来说优化潜力大(一堆看不懂的代码),然后就是基于这样理论多边形多,也可能是我不懂理解反而错了
PS2因为需要根据两个vu来手动写顶点处理代码,所以优化相对麻烦,要考虑流水线气泡等问题,所以当光源多了代码复杂化以后,普遍性能下降比较多。
但XBOX的NV2A的vertex shader本身就是硬件级别的多线程切换,天然就可以最大限度隐藏掉指令延迟,所以就基本没有这方面的性能担忧,而vertex shader带来的可编程性,也可以优化一些东西。另外一点就是像素单元的输入参数需要由顶点处理单元feed,这方面可编程的vertex shader就优势很大了,换句话说GC的fixed function T&L某种程度上会限制像素单元的功能发挥。
至于速度,不是说GC的Fixed function顶点单元效率差,而是XBOX的NV2A本身规格就要高出很多。
XBOX吃亏就吃亏在带宽受限,没法充分发挥性能(想充分发挥的话,内存容量起码也得翻倍),所以X360就吸取了教训,其实X360的EDram更像去掉Texture buffer强化ROP功能的PS2的edram设计,GC的1T-SRAM功能更灵活一些,它既有frame Buffer+Texture Buffer功能,同时也可以用作TextureCache,也就是纹理放内存里,1T-SRAM当作一个自动运作的Texture Cache。

[ 本帖最后由 hourousha 于 2021-6-22 14:43 编辑 ]



TOP

引用:
原帖由 真TMD是个粪青 于 2021-6-23 09:31 发表


ps2机能差不用黑吧。

现在想不起来了,他那6600万多边形到底是怎么吹的牛逼,以前记得有人科普过,好像也不能说是完全错误瞎吹,就是给了你一个很片面的结论。
6600万是两个vu啥都不干,只做顶点的空间变换(4x4矩阵乘法)+齐次坐标归一(除法),优化到家可以达到6600万顶点/s的速度,然后多边形使用三角条带(triangle strip),当多边形数量多后顶点数/多边形数趋近于1,因此就是6600万多边形。
按照这个方式,xbox不需要cpu或SSE单元参与计算,只用gpu,不需要做什么代码优化,就可以达到233M*2/6约77M顶点/s,然后XBOX有post-vs cache,因此可以使用triangle list形式的vertex index,这样对于网状的2D拓扑结构而言,多边形数/顶点数可以趋近2,这样一算就是150M多边形了。

[ 本帖最后由 hourousha 于 2021-6-23 10:02 编辑 ]


TOP

发新话题
     
官方公众号及微博