» 您尚未登录:请 登录 | 注册 | 标签 | 帮助 | 小黑屋 |


发新话题
打印

[业评] 次世代XBOX估计在架构上又是要玩四两拔千斤大逆转的戏码了~

引用:
原帖由 首斩破沙罗 于 2013-3-15 00:16 发表
这技术这么好的话,那些不计成本的高端显卡早就用上了
pc显卡一样有除显存之外的独立高速缓存,只可惜小的要死,一个Thread Group(对应一个cu)只能用32k(这是dx11,视硬件和api有所不同但无论如何都是几十k这个档次……)。GPGPU的性能优化很大程度上就是看怎么利用这些缓存,尽量在本地缓存计算,显存能少用就少用,非得用了还得合并,对齐等等从各种方面保证利用效率,不然实际可用带宽就是一坨翔。


TOP

引用:
原帖由 bsseven 于 2013-3-15 06:54 发表
这么小的CACHE对于GPU来说基本就是个摆设
如果你做过gpgpu开发,你就会发现这绝不是摆设。实时上大多数运算ps就能做了,早期的通用计算基本都是依赖ps做的,为什么现在用dc就能快那么多呢?就是因为用了这么一点点的缓存



TOP

引用:
原帖由 boboqpai 于 2013-3-15 12:19 发表


说道异构计算,我比较担心的是720的direct compute基础性能,cpu与gpu之间有个esram缓冲非常好,但它只有32MB,要知道比如寒霜2引擎里利用direct compute做的光照系统会大量吃显存,全局光照之类的,32MB是远远不 ...
那个不需要多少,一,这是分tile的,哪怕是pc显卡每个cu那么小的共享cache都够放。二,总量不过是一块屏幕分辨率这么大的图,就算全高清全部加起来也不过几M而已。三,寒霜2的gi是预计算的,不需要gpgpu,直接读显存就行。


TOP

我没说没有啊,我明显说的就是bf3的gpgpu用法啊,针对的是用缓存的多少而已。

TOP

真要比喻,车道数量可以比作带宽,延迟应该比作路程长度。
007同学说的那个文章看过,没什么太多内容。已知是两架都知道未来需要用gpgpu,不过一个主攻带宽一个主攻延迟。都有用,但具体两个谁高谁低,现在根本看不出来,泄露的东西完全无助于估计准确性能。大家多等等吧。(个人目前暂时偏向ps4)

TOP

说起来,今年e3什么时候开啊?

TOP

引用:
原帖由 倍舒爽 于 2013-3-19 02:26 发表
转篇东西,挺有意思。。
gaf几位提到的100%cu利用率该不是空穴来风。。

Why is it important to measure it?

The latency of the main memory directly influences the efficiency of the GPU, thus its perf ...
我一直在说对于现代显卡,存储器延迟方面的重要性,一直没人理解。

当然ms的新东西能在延迟上提升多少还是不知道,就算真的提升很多,怎么用好也是问题……等e3。

TOP

引用:
原帖由 讴歌123 于 2013-3-19 13:32 发表

那为何老黄的旗舰卡Titan还是用6G GDDR5,不用GDDR3+ESRAM?

显然MS和SCE的出发点是不一样的,MS一开始设计720时就以8G RAM为目标,各方面权衡妥协之下用了DDR3+ESRAM。而SCE一开始设计PS4时就以统一内存GDDR5为 ...
硬件的改变必须要api的配合,上层api不改,下面硬件改了怎么用?看看ati多少年前就弄了硬件tesselation就知道了。
游戏机可没这个限制,所以xbox360就有dx11的硬件tesselation,halo wars,pinata都用的。

另外,通用计算对延迟的敏感程度远超过从前单纯图形计算,所以现在改价值更大。

[ 本帖最后由 shinkamui 于 2013-3-19 13:36 编辑 ]

TOP

引用:
原帖由 讴歌123 于 2013-3-19 13:51 发表

除非MS像当年把C1的Unified Shader定义为DX10标准一样,次世代强行把什么ESRAM、DME之类的玩意儿定义为PC高端显卡(例如DX12?)的标准,逼开发厂商针对720架构进行优化。不然除了MS第一方哪家第三方吃饱了撑着针对 ...
降低延迟是所有高端开发商共同的心愿,有好东西不用那是自己跟自己过不去。这是游戏机不是电脑,做牛逼引擎的这几家必然是会充分利用好这一特性的。这玩意有什么用现在各家开发商可是非常清楚的。至于cell,cell在刚出来的时候大家知道这玩意有什么用么?其实cell不错但是离pc太远。720和普通pc的差异算40%,ps4就是15%,cell在当年看直接超过200%。就算在现在通用计算这么流行的情况下,cell仍然算异类。但即使如此,ps3上还是有第三方好好利用了cell不是么。

[ 本帖最后由 shinkamui 于 2013-3-19 14:00 编辑 ]

TOP

引用:
原帖由 讴歌123 于 2013-3-19 14:08 发表

你的说法必须建立在720的设计是MS听取了Epic和Crytek等牛逼引擎厂建议的前提下
1. 就算没听,做过开发的都知道需要什么。你觉得制定了direct compute标准的ms自己会不知道现在的瓶颈在哪里?
2. 你怎么知道ms没听呢?尤其在上代360明显就是听了epic建议的情况下。

TOP

引用:
原帖由 KoeiSangokushi 于 2013-3-20 09:26 发表

我记得好几个业内说微软平台的主机开发更困难
按理说次世代XBOX机能更低,又有XBOX360时代的铺垫,不应该困难到哪里去
没准就是因为ESRAM和DME这些特性的运用(背后可能就是通用计算和异构计算在游戏中的使用)造 ...
比原来难开发是肯定的,因为怎么用好cache直接需要改底层算法,没实力的公司没空没精力兼顾720和pc like两头,所有的计算shader都要写两份,数据结构全不一样,甚至架构流程都得跟着变,头大的很。
引用:
原帖由 XBOX720来临 于 2013-3-20 09:44 发表

之前问了下低延迟在实际游戏中会有哪些优势,也没人回答,是不是帧数足? 不会出现煤矿2那种假的举枪重量感?
kz2的举枪重量感一般是因为显示帧落后逻辑帧过多造成的,很可能是spe做后处理造成太多延迟,不过没办法确认是不是显存延迟拖的后腿,因为整个spe计算过程都可能造成延迟。当然,后处理确实通常是内存访问大户就是了。

gpu缓存的低延迟,直接结果就是cu的利用率和大显存带宽的利用率提升。就算我计算能力慢一半,但我能100%用,那结果还是比对手只能利用50%甚至不到的快(不是说720和ps4,东西没出来不好对比),这基本就是现在gpgpu算法优化的地方。
引用:
原帖由 讴歌123 于 2013-3-20 02:35 发表
请各位业内点评下这篇文章的观点看呢?这么看来32M ESRAM的确蛮牛逼的么 至于MS采用DDR3是为了减少延迟这种说法我看可以洗洗睡了,明显是GDDR5+ESRAM才是不差钱的终极选择……

http://vga.zol.com.cn/172/172 ...
我不是一直在说么,关于现在显卡32k的cache瓶颈我在23楼就说过了。

[ 本帖最后由 shinkamui 于 2013-3-20 12:29 编辑 ]

TOP

引用:
原帖由 讴歌123 于 2013-3-20 12:33 发表

巨硬可以把ESRAM作为标配硬性加入次世代DX标准,720就瞬间变得好开发了:D :D :D
不能随便就加的,变化太大,开发者未必跟进。pc比游戏机悲惨多了,现在的开发者很多时候都得兼容一大堆老显卡老系统。网游开发者还得考虑intel老gma卡,经常听到这帮人抱怨。还是游戏机开路的好

TOP

引用:
原帖由 XBOX720来临 于 2013-3-20 13:25 发表

问题是通用计算和异构计算在开发游戏时候的主要通途是什么? 能体现什么优势,厂商会不会看重这点呢.还有能不能尽量弥补GPU弱的那一块.
包括但不限于aa,bokeh focus,motion blur,ao,sss,shadow,oc,volume light,oit,volume rendering,multiple light,physics,ai等等等等。几乎所有的部分都可以用通用计算方式加速。另外如果esram真能当作全局缓存,那还有一堆普通架构直接不能做的新用法
本帖最近评分记录
  • 讴歌123 激骚 +2 人身攻击 2013-3-20 13:50

TOP

发新话题
     
官方公众号及微博