» 您尚未登录:请 登录 | 注册 | 标签 | 帮助 | 小黑屋 |


发新话题
打印

非战只是来问问世嘉粉dc这台主机nb在哪?

PS2的T&L性能可不弱,别忘了PS2的GS的单pass功能简单直追N64,基本全靠多pass实现效果,这很吃顶点机能的。而且用VU,虽然效率不如hard-wired的T&L或者半hard-wired的VS,但可编程性最强啊。
说起来,DX7级别的T&L其实挺鸡肋,因为可编程性实在有限。限制了像素部分的很多功能。
DC比PS2差的最多的其实还是在光栅化处理器这块,应该说PS2走的就不是当年的正确路子,但起码在‘傻快’这一块做到了相当的高度。而DC虽然走的路子在当年没什么偏差,但比PS2早了一年半,导致了它并没办法比PS2的GS'聪明'多少,而又完全没有‘快’的一面,因此就悲剧了。
当然,PS2的设计当然是有遗憾欠缺平衡的,最大问题就是显存部分容量太低。导致了发挥受到很多限制。
相对而言,DC设计在当时还算是比较平衡的。
GC也还算比较平衡,而XBOX则在内存带宽上吃了大亏,这也导致X360上EDRAM。


TOP

引用:
原帖由 KainX 于 2015-9-6 19:08 发表

Xbox的DDR内存带宽没什么问题,6.4G不算很快但肯定够用,尤其大多游戏都是480p。

DC、PS2、GC、XBOX这几部游戏机构架相差很远,在无法跑分的情况下(Xbox可以)直接对比数据很难准确判断机能差距。
不过因为有 ...
我们不妨来简单算笔账
1:XBOX的texel fillrate是1.86GTexel/s,因为它有4个TMU,但每个tex指令是1statge,也就是0.5cycle。
我们按常用的压缩纹理格式,也就是DXT5,平均一个texel是8bit,bi-linear需要2x2,因此仅算bi-linear的tex指令,想要不产生瓶颈,需要的带宽就是1.86*4Byte,这就超过6.4GB了。
2:按照透视变换的算法,XBOX的顶点吞吐在70M/s以上,即使一个顶点按32字节算(只是3位置+3法线+一组UV而已,没算多组UV与法线贴图的向量,和骨骼动画的权重与索引),那么顶点部分的带宽也要2GB以上。
3:XBOX的pixel fillrate是0.93Gpixel/s,即使不算MSAA,不算alpha blending,那么需要的典型带宽也是0.93*(4byte colorwrite+4byte z/s read+4byte z/s write)>10GB/s,哦,您说NV2A有depth buffer compression,咱按最最理想,显然不可达到的始终1:4压缩(因为写入时容易造成block存在非连续Z值而无法压缩),那么也是0.93*(4+1+1?)>5.5G,可别忘了这没算alpha blending,来个alphablending就基本翻一倍,如果再算MSAA的话……
4:XBOX的内存带宽,CPU也要占用。
于是您来告诉我XBOX的内存带宽怎么个肯定够用?
也就是说,XBOX尽管是那代主机里无可争议的性能霸主,但实际在设计上并没有做到平衡,如果能够改善内存带宽,甚至再增加一些内存的话,那么XBOX所能呈现的效果,还会有相当的提升。

另:关于PS2的T&L机能,ea曾经在一个跨平台引擎上做过测试,PS2与GC,Radeon 8500的顶点性能基本持平。XBOX在未经post vs cache优化的情况下是2倍有余。当然,GC与XBOX,Radeon 8500,可以用较少的pass实现PS2多pass,甚至实现不了的效果,所以最终PS2还是除了少数极端情况(比如全是纯色粒子)外,输给了更先进架构。
如果让我来排
PS2机能100的话,DC差不多是30,N64是5,GC是180,XBOX是350,差不多这样。



本帖最近评分记录
  • SONIC3D 激骚 +5 感谢分享 2015-9-7 00:16

TOP

引用:
原帖由 KainX 于 2015-9-7 00:47 发表

不能样样按照峰值输出算,这个看起来就比较合理:http://segatech.com/technical/consolecompare2/
Xbox的NV2A有专门的反锯齿处理单元,4X以下并不需要过多的带宽。
而且480p带宽够用不是我说的:http://www.pcm ...
现在讨论的是XBOX的带宽限制了性能发挥,而不是近似伪命题的‘480p下够不够’的问题啊。
现实情况就是,XBOX的带宽,甚至不足以支撑TMU或ROP的单独全速运行,何况流水线化的GPU会多个部分同时使用带宽,而且还有CPU使用带宽的情况。
直接看微软自己写的就知道,摘自X360的XDK
引用:
The maximum triangle rate of the Xbox GPU is 117 million triangles per second, which only can be achieved with near perfect post-transform vertex reuse and a simple vertex shader. The Xbox 360 GPU can consistently achieve more than four times the Xbox GPU triangle rate with minimal vertex reuse and a complex vertex shader. The maximum pixel fill rate of the Xbox GPU is 933 million pixels per second, which can only be achieved in very limited circumstances due to memory bandwidth constraints. For example, alpha blending with a 32-bit frame buffer with no z-buffering and no texture fetching requires 7.466 GB/sec of bandwidth, which exceeds the Xbox memory bandwidth of 6.4 GB/sec. The Xbox 360 GPU can consistently achieve more than four times the Xbox GPU fill rate with full alpha blending, z-buffering, and 4× multisampling.


TOP

引用:
原帖由 KainX 于 2015-9-7 11:03 发表

Xbox的设计师Seamus Blackley在系统发售时承认HDTV分辨率下Xbox因为带宽瓶颈要在画质和帧率之间做选择,但我开始就说以480p为标准讨论……
问题是我一开始的回帖说的是XBOX的内存带宽很成问题,对其余部分造成瓶颈,并没有限定什么输出分辨率,所以我不明白你后来一定要扯到分辨率的逻辑。
而且,480p下够不够,这本身就是一个伪命题。就好像从05年底到现在都在说,到底什么配置才能真1080p啊,相同分辨率不同水准的画面,当然对带宽要求也是不同的。最简单的,带宽更高的话,显然可以使用更大的纹理(因为纹理大小对texture cache命中有影响),使用更好的纹理过滤,添加更多的粒子,使用MSAA。

TOP

引用:
原帖由 KainX 于 2015-9-7 00:48 发表

DC是30的话Naomi和Naomi2是多少?照您这排法Naomi2和PS2差不多哦。
这个问题我没有把握,因为对这俩街机了解不多。只能结合网上的资料随便说说。你看看就算
首先呢,在那个内存受限年代,有时内存的多少,会直接产生‘你无我有’的效果。
比如,如果只比raw power,PS2的GS性能是DC的PVR-CLX2的十倍以上,但GS受edram容量限制严重。
1:GS的edram只有4M,而当前渲染用到的framebuffer与texture data必须存在edram之中
2:GS不支持纹理压缩
3:GS的edram和纹理是texture buffer的类型而不是texture cache的类型,也就是说需要开发者手动把当前这些渲染指令用到的纹理data传进edram而不是像GC那样可以把texture放在主内存里,GPU自动动态地根据当前渲染需要把一张纹理的一小部分传进1T-SRAM。
4:edram和主mem的带宽并不算高,还有竞争问题。
因此,哪怕ps2的主内存足够大,由于edram足够小,因此如果渲染的内容用到的纹理比较细致,一方面要把物体分割成一块一块,使每一块用到的纹理能够塞进剩下的edram中,而且还需要频繁地做mem->edram的数据交换,这就大大降低了速度,因此大多数PS2游戏使用纹理都相当拮据,索引色纹理使用很普遍。同时虽说GS功能原始,但其实理论上也是可以单geo pass双贴图的(起码可以节约顶点运算),但前提是得把两个贴图都放到edram中……
所以这样看来,GS由于成本等问题容量过于小的edram,很大程度阻碍了GS的性能发挥。
相对而言,DC的PVRCLX2,尽管性能由于时代原因很落后,但瓶颈却不那么明显,显存8M比PS2要大并且支持一定程度的纹理压缩,还有降低不必要overdraw的片上延迟渲染技术。因此说DC是相对而言更平衡的一台主机。而GS比PVRCLX2强一个数量级的raw power,并没有完全体现出来,我认为我给DC个30分,还是相对靠谱的(两者的CPU也基本就是3倍左右差距)
从网上的资料,貌似naomi是内存显存倍增版的DC?像我前面所说,那个年代,内存显存的容量其实也很重要,所以尽管naomi1相对DC的raw power没有增加什么,但naomi还是能比DC做的好不少,我觉得大概45-50左右吧。
naomi2相比naomi1貌似是CPU GPU数量翻倍,显存翻倍,并且GPU频率也翻倍,并增加了T&L单元的版本?那比PS2的效果好就毫不奇怪了啊,一方面,硬件T&L弥补了CPU矢量方面的差距,而CPU数量还倍增,那么CPU方面已经强于PS2了。显卡方面,当然比raw power,还是会比GS低,但就像我前面说的,GS受限严重,而naomi2的显存数量已经达到32MB,因此naomi2普遍比PS2效果好是可以预见的,我觉得可能150-160左右吧。

TOP

引用:
原帖由 KainX 于 2015-9-7 12:18 发表

因为对比对象是DC、PS2和GC,这几个就是480p标准,说到相同分辨率不同画质和带宽要求、对这几个也是一样的。
而且XBOX在480p下带宽够不够是不是伪命题你不应跟我讨论,这是Seamus Blackley和PCMAG的观点。
事实就是XBOX的其他性能都明显比PS2与GC强,但带宽这块反而持平甚至不如(起码PS2和GC都有专门解决framebuffer需要高带宽的方案),因此这就是瓶颈,我说的就是这个瓶颈的问题,咱别胡抬杠好吗?
计算方法与MS的话我也给出了,您觉得都不如您那俩权威,XBOX带宽就是足,那也就这样吧。

TOP

引用:
原帖由 KainX 于 2015-9-7 12:33 发表

大体同意,只是PS2的执行效率比你想象的还要低。
PS2移植了两个NAOMI2游戏:VF4和Initial D,
首先分辨率都减半(480p:448i),这样NAOMI2就至少有200了,然后贴图分辨率、阴影分辨率、背景细节/特效都有不同程度 ...
在我看来,数值不是您这么算的,要考虑到一个lead-platform的问题。
比如说,VF4本身就是按照naomi2的规格做的,适应的就是naomi2的特性,然后往PS2一移植,发现内存小了一半,显存只有1/8,那咋办?缩呗,至于是不是在针对PS2增加一些针对性的特效,看厂商的心情了呗。GC也是类似的情况。
前一段时间不是那谁,好像是移植《神之手》的说的吧,为啥PS3无法在高清下满帧运行,是因为PS2的带宽问题,PS3无法提供高清化后所需的带宽……按PS3的性能,跑全高清PS2水准的游戏,当然不会有任何问题,但如果按照‘PS2’的运行方式,去高清化PS2游戏,带宽就会捉襟见肘,这就是说,机能特性差别很大的主机,互相移植,参考性其实有限,反过来,把PS2上的一些游戏或GC上用到EMBM等特性的,往Naomi2上移植,结果会咋样,其实也可想而知。
Naomi2的GPU和GC根本上就差着代呢,如果说Naomi2可以利用大得多的内存显存,做一些GC难以做到的东西,那么反过来GC也可以用更先进的架构做一些Naomi2根本做不到的东西。
当然,以上只是我的看法而已。

TOP

引用:
原帖由 lemonninja 于 2015-9-9 22:08 发表


XB的GPU是NV20改版,也就是GF3级别的。

DC的CPU里面有VGE用来做T&L,也就是相当于EE里面的VU,所以才有理论1.4GFLOPS。如果真要比较游戏性能的话应该找带SSE指令的PIII
XB的NV2A,相比NV20,倍增了vs单元,从这角度讲,更接近NV25而不是NV20
基本来说,如果按照上个图的3dmark2001,NV25的1 light polygon count大概在45M左右,已经是用P3跑出来的20倍了。
另一个方面,用PC上的D3D,跑NV1x-NV2x,基本来说像素部分运算性能要打个非常大的折扣,因为从Geforce256开始,像素部分(register combiner)就是四进三出的结构。外加还有免费的final combiner,因此MS在XDK里,除了ps1.1外,还特意增加了xps 1.1,为的就是对应register combiner与final combiner。这支持了一些高级指令,比如xdd,这是双点积(双dp3)指令。而一个复杂指令依然是1stage,也就是0.5cycle,因此NV2A其实每个周期可以做4*2*2=16次dp3,仅就这个次数而言已经超过ATI R300了(它只有add可以做单周期16次,dp3是8次,当然,它精度是FP24的)。当年NV特意写过paper较大家使用Opengl与register combiner实现单周期的bumpmapping(bump diffuse+bump specular,specular部分没记错使用的是H dot N,H dot H 的2D indirect mapping来处理V向量的归一化问题)。
其实说起来,XBOX和DC直接比较,本身就很荒唐了,光功能上就差了两代。

TOP

发新话题
     
官方公众号及微博