Board logo

标题: [业评] 次世代XBOX估计在架构上又是要玩四两拔千斤大逆转的戏码了~ [打印本页]

作者: KoeiSangokushi    时间: 2013-3-14 23:17     标题: 次世代XBOX估计在架构上又是要玩四两拔千斤大逆转的戏码了~

DATA MOVE ENGINE(DME)非常聪明,通俗点说就是乾坤大挪移
把CPU每个模块(每一个模块包含4个物理核心)需要的高速缓存,GPU每个流处理器合集(CU,每一个CU包含64个流处理器)需要的高速缓存,主内存,全部统一地址和桥接了,同时附加了非常先进的资源回收机制

32MB ESRAM是迄今最低延迟的RAM之一,仅有GDDR5延迟的十分之一,同时提供102GB/S的带宽
在DME的加成作用之下,可以极大的满足当今主流GPU对数据交换极为琐碎、繁杂、细微的要求,也就是对低延迟的要求

反观PS4虽然拥有更多的GPU流处理器数量和更高的主内存带宽,但是延迟却是致命伤,因为索尼就是装了台传统架构的PC(PSV则基本可以看作是找三星做了台贴牌5寸小平板)

天下武功,唯快不破,次世代XBOX基本是把快做到了极致,我看好微软的全新架构再次上演低硬件成本凭借先进理念实现大逆转的好戏:D

[ 本帖最后由 KoeiSangokushi 于 2013-3-14 23:33 编辑 ]
作者: 石指圣    时间: 2013-3-14 23:19

posted by wap, platform: Nokia (Lumia 800)

计算机组成原理学的不好,现在看帖越来越费劲了
作者: AngryMulch    时间: 2013-3-14 23:21

不错不错 7850M的逆袭
作者: AngryMulch    时间: 2013-3-14 23:24

啃奶一个世代妥妥的
作者: qwased    时间: 2013-3-14 23:36

posted by wap, platform: ZTE (V970)

再怎么鼓捣,gpu也就那么回事了
作者: 0瞎子0    时间: 2013-3-14 23:39

posted by wap, platform: Huawei (C8950D)

汽车开再快,收费站收费慢也是惘然
作者: KoeiSangokushi    时间: 2013-3-14 23:42

引用:
原帖由 qwased 于 2013-3-14 23:36 发表
posted by wap, platform: ZTE (V970)

再怎么鼓捣,gpu也就那么回事了
2008年那阵子,出过一种标配DDR2显存的9800GT
这玩意和标配DDR3的9600GT相比谁更强我想你应该能猜的到
尽管9600GT的SP数量只有9800GT的一半

PS4搭载8GB GDDR5很厚道很良心
但是现在时代已经发生变化,主流GPU其实对小范围低延迟数据的吞吐需求在飞速增长,传统PC架构由于惯性和兼容性考虑,对这一诉求没有给予充分的正面回应,但是微软有实力在一个封闭平台上做到
也就是搭载32MB ESRAM,并配合以DME

[ 本帖最后由 KoeiSangokushi 于 2013-3-14 23:46 编辑 ]
作者: KoeiSangokushi    时间: 2013-3-14 23:44

引用:
原帖由 0瞎子0 于 2013-3-14 23:39 发表
posted by wap, platform: Huawei (C8950D)

汽车开再快,收费站收费慢也是惘然
你的比喻可能恰好反了
GDDR5我认为可以比喻为一个超级高速度和高载重量的大货车
但是它的延迟(启动和制动性能)并不佳
所以最终它在实机送货任务中可能反而是更慢的那一个
作者: lady    时间: 2013-3-14 23:47

posted by wap, platform: iPhone

自从新主机公布以来,tg一下子冒出一群计算机硬件专家来,各种名词乱飞完全看不懂
作者: 软膏    时间: 2013-3-14 23:47

posted by wap, platform: SonyEricsson (Xperia P)

三红就是这么拔千斤拔出来的
作者: KoeiSangokushi    时间: 2013-3-14 23:50

引用:
原帖由 软膏 于 2013-3-14 23:47 发表
posted by wap, platform: SonyEricsson (Xperia P)

三红就是这么拔千斤拔出来的
一个人不应当连续犯两次同样的错误
PS4这回也没有学PS3标新立异搞CELL了,老老实实整X86架构的CPU
作者: 小色    时间: 2013-3-14 23:54

如果纸面30%,实际效果差距不大,我就入720了,确实效果差太多,就从pc
作者: cynic0522    时间: 2013-3-15 00:03

次时代就是电脑打电脑。
作者: ドラゴンナイト    时间: 2013-3-15 00:06

感觉LZ有点向MS的精神股东靠拢,油然而生的自豪感与信心感
作者: 小僵尸    时间: 2013-3-15 00:08

仓鼠帝上下嘴皮一动

立马就是大逆转了

这个百度贴吧混久了确实有点.......
作者: 2006arg    时间: 2013-3-15 00:09

posted by wap, platform: iPhone

好吧现在开始吹低延时了。。。
作者: ylgtx    时间: 2013-3-15 00:09

posted by wap, platform: iPad

gddr5的高延迟顶多对cpu有影响,对gpu则是主流,连顶级gpu泰坦都用的gddr5,大容量大带宽才是趋势
作者: 首斩破沙罗    时间: 2013-3-15 00:16

这技术这么好的话,那些不计成本的高端显卡早就用上了
作者: KoeiSangokushi    时间: 2013-3-15 00:18

引用:
原帖由 首斩破沙罗 于 2013-3-15 00:16 发表
这技术这么好的话,那些不计成本的高端显卡早就用上了
在PC上你得考虑兼容性问题
作者: Alusell    时间: 2013-3-15 00:26

这年头想出名真是要脱的干干净净才行.
期待楼主下一只大片.
作者: sega2006    时间: 2013-3-15 00:45

谁他妈在乎这个,光环5在哪里我就在哪里
作者: 首斩破沙罗    时间: 2013-3-15 00:49

引用:
原帖由 sega2006 于 2013-3-15 00:45 发表
谁他妈在乎这个,光环5在哪里我就在哪里
对,这个论据比楼主的好
作者: shinkamui    时间: 2013-3-15 01:29

引用:
原帖由 首斩破沙罗 于 2013-3-15 00:16 发表
这技术这么好的话,那些不计成本的高端显卡早就用上了
pc显卡一样有除显存之外的独立高速缓存,只可惜小的要死,一个Thread Group(对应一个cu)只能用32k(这是dx11,视硬件和api有所不同但无论如何都是几十k这个档次……)。GPGPU的性能优化很大程度上就是看怎么利用这些缓存,尽量在本地缓存计算,显存能少用就少用,非得用了还得合并,对齐等等从各种方面保证利用效率,不然实际可用带宽就是一坨翔。
作者: boboqpai    时间: 2013-3-15 03:33

引用:
原帖由 ylgtx 于 2013-3-15 00:09 发表
posted by wap, platform: iPad

gddr5的高延迟顶多对cpu有影响,对gpu则是主流,连顶级gpu泰坦都用的gddr5,大容量大带宽才是趋势
意思是说“泰坦”这样的怪兽使用小小容量片内超高速缓存+GDDR5已经遇到严重瓶颈,拭目以待。

另说一下使用低带宽的ddr3还必须要用到类似data move enjine这种技术,否则不能满足各模块带宽需求。

[ 本帖最后由 boboqpai 于 2013-3-15 04:08 编辑 ]
作者: west2046    时间: 2013-3-15 03:41

引用:
原帖由 小色 于 2013-3-14 23:54 发表
如果纸面30%,实际效果差距不大,我就入720了,确实效果差太多,就从pc
纸面没跑,实际差距等画面出来再对比

把期待降低点就好
作者: bsseven    时间: 2013-3-15 06:54

这么小的CACHE对于GPU来说基本就是个摆设
作者: 倍舒爽    时间: 2013-3-15 09:09

引用:
原帖由 bsseven 于 2013-3-15 06:54 发表
这么小的CACHE对于GPU来说基本就是个摆设
对于异构运算来讲,不尽然。。
http://wenku.baidu.com/view/2be3983a83c4bb4cf7ecd152.html
中文的,我也只是看了我自己懂的部分。。

这方面720可能会有较大优势。。
引用:
原帖由 boboqpai 于 2013-3-15 03:33 发表


意思是说“泰坦”这样的怪兽使用小小容量片内超高速缓存+GDDR5已经遇到严重瓶颈,拭目以待。

另说一下使用低带宽的ddr3还必须要用到类似data move enjine这种技术,否则不能满足各模块带宽需求。
反过来想想看,ms作为图形标准制定者,为了面向未来以gpgpu based渲染方式,以后的显卡都带cache也说不定。。
再以后的显卡,甚至rop也会取消掉。。gpu会做得越来越像cpu。。

[ 本帖最后由 倍舒爽 于 2013-3-15 09:17 编辑 ]
作者: lili2k2    时间: 2013-3-15 09:22

对次世代持失望态度,

不管m还是s,都完全令人感不到所谓的次世代。

与其研究这两个矮子哪个当将军,还不如游戏机独占,PC全平台养眼。

PS4、720肯定都会入,至于什么nb的画面和它们已经没关系了,那是pc的事。
作者: shinkamui    时间: 2013-3-15 12:10

引用:
原帖由 bsseven 于 2013-3-15 06:54 发表
这么小的CACHE对于GPU来说基本就是个摆设
如果你做过gpgpu开发,你就会发现这绝不是摆设。实时上大多数运算ps就能做了,早期的通用计算基本都是依赖ps做的,为什么现在用dc就能快那么多呢?就是因为用了这么一点点的缓存
作者: Wuhaok    时间: 2013-3-15 12:14

posted by wap, platform: Galaxy Nexus

不明!觉厉!
作者: boboqpai    时间: 2013-3-15 12:19

引用:
原帖由 倍舒爽 于 2013-3-15 09:09 发表


对于异构运算来讲,不尽然。。
http://wenku.baidu.com/view/2be3983a83c4bb4cf7ecd152.html
中文的,我也只是看了我自己懂的部分。。

这方面720可能会有较大优势。。




反过来想想看,ms作为图形标 ...
说道异构计算,我比较担心的是720的direct compute基础性能,cpu与gpu之间有个esram缓冲非常好,但它只有32MB,要知道比如寒霜2引擎里利用direct compute做的光照系统会大量吃显存,全局光照之类的,32MB是远远不够的,再综合考虑那30%的gpu计算能力,我还是持保守看法。
作者: Xerxes    时间: 2013-3-15 12:24

这是PS2的4M镶入显存四两拨千金战XBOX的64MDDR吗
作者: shinkamui    时间: 2013-3-15 12:27

引用:
原帖由 boboqpai 于 2013-3-15 12:19 发表


说道异构计算,我比较担心的是720的direct compute基础性能,cpu与gpu之间有个esram缓冲非常好,但它只有32MB,要知道比如寒霜2引擎里利用direct compute做的光照系统会大量吃显存,全局光照之类的,32MB是远远不 ...
那个不需要多少,一,这是分tile的,哪怕是pc显卡每个cu那么小的共享cache都够放。二,总量不过是一块屏幕分辨率这么大的图,就算全高清全部加起来也不过几M而已。三,寒霜2的gi是预计算的,不需要gpgpu,直接读显存就行。
作者: 超越梦想    时间: 2013-3-15 12:30

posted by wap, platform: iPhone

过分神话esram和ff大神神话虚拟内存一个道理
作者: boboqpai    时间: 2013-3-15 12:32

引用:
原帖由 shinkamui 于 2013-3-15 12:27 发表

那个不需要多少,一,这是分tile的,哪怕是pc显卡每个cu那么小的共享cache都够放。二,总量不过是一块屏幕分辨率这么大的图,就算全高清全部加起来也不过几M而已。三,寒霜2的gi是预计算的,不需要gpgpu,直接读显 ...
从资料看寒霜2是使用了direct compute,而且direct compute作为dx11标准和apu强项,以后应用会越来越多的。
作者: 倍舒爽    时间: 2013-3-15 12:36

引用:
原帖由 shinkamui 于 2013-3-15 12:27 发表

那个不需要多少,一,这是分tile的,哪怕是pc显卡每个cu那么小的共享cache都够放。二,总量不过是一块屏幕分辨率这么大的图,就算全高清全部加起来也不过几M而已。三,寒霜2的gi是预计算的,不需要gpgpu,直接读显 ...
记忆中是有的。。
还有justcause2也是本世代罕有把直接计算利用到图形上的游戏。。
搜了下:
http://www.pcgameshardware.com/aid,699698/11-Days-of-DirectX-11-AMD-interview-with-Battlefield-developer-DICE/News/

更正下:
fb2是有的,但bf3就不一定。。
因为一开始bf3的企划本来是不向主机妥协的,但到中期屈服了,规模也更改了~
相信bf4才能真正体现到fb2的实力吧。。

[ 本帖最后由 倍舒爽 于 2013-3-15 12:39 编辑 ]
作者: shinkamui    时间: 2013-3-15 12:43

我没说没有啊,我明显说的就是bf3的gpgpu用法啊,针对的是用缓存的多少而已。
作者: amego    时间: 2013-3-15 13:02

引用:
原帖由 Xerxes 于 2013-3-15 12:24 发表
这是PS2的4M镶入显存四两拨千金战XBOX的64MDDR吗
呵呵,不懂就别喷了,如果按照计算机体系结构的概念来比喻的话,显存相当于内存,内存相当于硬盘,而esram相当于cache(虽然速度差距上没有cache这么大),你用内存和硬盘的速度差距来对比cache和硬盘的速度差距,根本就是无知
作者: ffcactus    时间: 2013-3-15 18:19

posted by wap, platform: iPhone

这和一个文科生和你讲物理学一个感觉。。。连喷的欲望都没有。
作者: Xerxes    时间: 2013-3-15 18:26

引用:
原帖由 amego 于 2013-3-15 13:02 发表

呵呵,不懂就别喷了,如果按照计算机体系结构的概念来比喻的话,显存相当于内存,内存相当于硬盘,而esram相当于cache(虽然速度差距上没有cache这么大),你用内存和硬盘的速度差距来对比cache和硬盘的速度差距, ...
您老还是去了解一下xbox,360,PS4的内存系统吧
作者: KoeiSangokushi    时间: 2013-3-15 18:34

posted by wap, platform: iPhone
引用:
原帖由 @ffcactus  于 2013-3-15 18:19 发表
posted by wap, platform: iPhone

这和一个文科生和你讲物理学一个感觉。。。连喷的欲望都没有。
所以说果然还是虚拟内存赢了啊!
作者: 狂风007    时间: 2013-3-16 11:16

看了前面大师们发言,我硬件小白好像懂了:

就是PS4用8G DDR5内存没什么用处,720的8G DDR3+32M ES不但价格更低,而且效果更好,所谓的四两拨千斤,是不是这个道理?

不过那篇预测神文里说,无论微软如何调整处理,那32MB的ESRAM到头来只是一种打补丁的做法,远远不及Orbis的单一模块组那么迅速而效率高。但是,虽然Durango的劣势很明显,并不意味着会对他的发展造成毁灭性的影响。在于游戏制作者的交谈中,我们得知游戏里面不是所有内容都会用到超高速内存。游戏系统还是会基于DDR3制作,但当发生内存带宽限制的问题,这些内容会被转移到拥有足够带宽的ESRAM。

原文:http://club.tgfcer.com/viewthrea ... =%B0%C2%B1%C8%CB%B9

请shinkamui朋友看看这篇原文,说得靠谱不?
作者: 狂风007    时间: 2013-3-16 11:18

引用:
原帖由 shinkamui 于 2013-3-15 12:43 发表
我没说没有啊,我明显说的就是bf3的gpgpu用法啊,针对的是用缓存的多少而已。
请看看这篇
http://club.tgfcer.com/viewthrea ... =%B0%C2%B1%C8%CB%B9

你认为它说得靠谱吗?
作者: 20年后大律师    时间: 2013-3-16 11:36

神机4赢了,Xbox宝石,over
作者: west2046    时间: 2013-3-16 11:53

谁说PS4用8G DDR5内存没什么用处?

PS4就一PC,基本可以预计,720和PC差别大点有不可预计的地方
作者: taojin82    时间: 2013-3-16 12:07

别把延迟 真当回事 GDDR5 提供的整体带宽 不是巧实力能解决的

这一代机器 内部大量数据吞吐 PS3 靠谱的多 不要自己想什么就无线扩大

SONY 硬件设计师门 架构师门 不是路边卖热干面的
作者: KoeiSangokushi    时间: 2013-3-16 12:12

引用:
原帖由 taojin82 于 2013-3-16 12:07 发表
别把延迟 真当回事 GDDR5 提供的整体带宽 不是巧实力能解决的

这一代机器 内部大量数据吞吐 PS3 靠谱的多 不要自己想什么就无线扩大

SONY 硬件设计师门 架构师门 不是路边卖热干面的
一个是最高速度极高但制动一般的车
一个是最高速度较低但制动超强的车

这两辆车如果是直线加速肯定前者赢
如果是盘山路烂泥路后者估计要完胜
作者: taojin82    时间: 2013-3-16 12:24

都说了 你太绝对

一个是最高速度极高但制动一般的车
一个是最高速度较低但制动超强的车

我可以理解为 SONY 是条16车道高速公路

微软也是8车道 中间个专门加速带 可以把大卡车 货车提前通过

款且规则的定制 数据吞吐实时满点 这完全不可能

你真以为什么游戏需要实时流动100G 数据么

你想要软件公司程序员 都呕血而亡么

[ 本帖最后由 taojin82 于 2013-3-16 12:28 编辑 ]
作者: 首斩破沙罗    时间: 2013-3-16 12:47

DDR3和5的带宽差距不止16车道和8车道吧
作者: KoeiSangokushi    时间: 2013-3-16 12:48

引用:
原帖由 首斩破沙罗 于 2013-3-16 12:47 发表
DDR3和5的带宽差距不止16车道和8车道吧
16车道和6车道
作者: taojin82    时间: 2013-3-16 12:52

真正的车是数据流 所以你比喻很不正确
作者: shinkamui    时间: 2013-3-16 15:26

真要比喻,车道数量可以比作带宽,延迟应该比作路程长度。
007同学说的那个文章看过,没什么太多内容。已知是两架都知道未来需要用gpgpu,不过一个主攻带宽一个主攻延迟。都有用,但具体两个谁高谁低,现在根本看不出来,泄露的东西完全无助于估计准确性能。大家多等等吧。(个人目前暂时偏向ps4)
作者: cp251    时间: 2013-3-18 11:48

引用:
原帖由 KoeiSangokushi 于 2013-3-14 23:17 发表
32MB ESRAM是迄今最低延迟的RAM之一,仅有GDDR5延迟的十分之一,同时提供102GB/S的带宽
在DME的加成作用之下,可以极大的满足当今主流GPU对数据交换极为琐碎、繁杂、细微的要求,也就是对低延迟的要求 ...
既然说到主流gpu,不知道哪种主流gpu采用这种设计的?

这算自抽耳光么?
作者: 你老闆    时间: 2013-3-18 12:33

B3D有人說720的傳聞GPU跟7790差不多
不過7790是啥卡
作者: KoeiSangokushi    时间: 2013-3-18 12:35

posted by wap, platform: iPhone
引用:
原帖由 @你老闆  于 2013-3-18 12:33 发表
B3D有人說720的傳聞GPU跟7790差不多
不過7790是啥卡
比7850差,不就是那个768SP的传言么
作者: 你老闆    时间: 2013-3-18 12:38

引用:
原帖由 KoeiSangokushi 于 2013-3-18 12:35 发表
posted by wap, platform: iPhone

比7850差,不就是那个768SP的传言么
7790當然沒比7850強,超頻情況下才會很接近
http://forum.beyond3d.com/showthread.php?p=1719399#post1719399
有趣的是7790的頻寬跟傳聞版720的esram頻寬一樣,不知是否有關
作者: aichan    时间: 2013-3-18 12:50

画面多根毛少个毛孔都无所谓了
用惯了LIVE换PSN会难受的
PS4还是
专心等破解……
作者: nikutai    时间: 2013-3-18 12:52

posted by wap, platform: UC

同一时代,同一制程下的芯片性能不 会有什么太大差别,谁要有火星科技那其他厂家都别想活了,战性能纯蛋痛。
作者: 妹妹的G点    时间: 2013-3-18 12:53

posted by wap, platform: Galaxy Note

平井四神器ps4?
作者: 2006arg    时间: 2013-3-18 14:20

引用:
原帖由 你老闆 于 2013-3-18 12:33 发表
B3D有人說720的傳聞GPU跟7790差不多
不過7790是啥卡
128BIT,1G的频率,接近7850
作者: KoeiSangokushi    时间: 2013-3-18 14:24

引用:
原帖由 你老闆 于 2013-3-18 12:38 发表

7790當然沒比7850強,超頻情況下才會很接近
http://forum.beyond3d.com/showthread.php?p=1719399#post1719399
有趣的是7790的頻寬跟傳聞版720的esram頻寬一樣,不知是否有關
封装在APU里超频会很难受吧
我的意思是太热,降低稳定性,增加散热成本
作者: 你老闆    时间: 2013-3-18 14:38

引用:
原帖由 KoeiSangokushi 于 2013-3-18 14:24 发表

封装在APU里超频会很难受吧
我的意思是太热,降低稳定性,增加散热成本
PS4還不是封裝在APU裡
況且就算是7790估計也是非超頻版,降低熱量
另外7790似乎算GCN2

[ 本帖最后由 你老闆 于 2013-3-18 14:49 编辑 ]
作者: shiningfire    时间: 2013-3-18 14:48

这啥鬼?
[attach]516613[/attach]
[attach]516614[/attach]
[attach]516615[/attach]
作者: KoeiSangokushi    时间: 2013-3-18 14:55

posted by wap, platform: iPhone
引用:
原帖由 @你老闆  于 2013-3-18 14:38 发表
PS4還不是封裝在APU裡
況且就算是7790估計也是非超頻版,降低熱量
另外7790似乎算GCN2

1075MHz是标准频率还是超频频率?
作者: 你老闆    时间: 2013-3-18 15:12

引用:
原帖由 KoeiSangokushi 于 2013-3-18 14:55 发表
posted by wap, platform: iPhone

1075MHz是标准频率还是超频频率?
藍寶石牌的,應該超了(1075MHz),不過原版頻率估計也比傳聞的800高就是,當然微軟可以考慮下提到1000,如果傳聞的800是真的
作者: 倍舒爽    时间: 2013-3-18 16:40

posted by wap, platform: iPhone
引用:
原帖由 @你老闆  于 2013-3-18 15:12 发表
藍寶石牌的,應該超了(1075MHz),不過原版頻率估計也比傳聞的800高就是,當然微軟可以考慮下提到1000,如果傳聞的800是真的
没超,原文也这么说了,gpuz也显示了
另外如果vgl的例子属实的话,全负载下的带宽能去到13xgps,比这所谓的7790还要快

本帖最后由 倍舒爽 于 2013-3-18 16:42 通过手机版编辑
作者: 你老闆    时间: 2013-3-18 18:14

引用:
原帖由 倍舒爽 于 2013-3-18 16:40 发表
posted by wap, platform: iPhone

没超,原文也这么说了,gpuz也显示了
另外如果vgl的例子属实的话,全负载下的带宽能去到13xgps,比这所谓的7790还要快

本帖最后由 倍舒爽 于 2013-3-18 16:42 通过手机版编辑 ...
超了,那表都寫著7790OC
你說那個是DDR3的,我是說ESRAM的102.4,不過是改進版也不奇,畢竟720的GPU似乎是256bit,普通7790還是128
作者: shinkamui    时间: 2013-3-18 20:27

说起来,今年e3什么时候开啊?
作者: shiningfire    时间: 2013-3-18 20:50

6月11,12,13
作者: 倍舒爽    时间: 2013-3-19 01:52

引用:
原帖由 你老闆 于 2013-3-18 18:14 发表

超了,那表都寫著7790OC
你說那個是DDR3的,我是說ESRAM的102.4,不過是改進版也不奇,畢竟720的GPU似乎是256bit,普通7790還是128
这我就很不理解了,因为tom是这样写的。。
so much so that AMD has apparently asked manufacturers not to release overclocked versions of the card for fear of it surpassing and consequently crippling sales of the HD 7850. This implies that the Bonaire XT GPU holds a lot of potential for overclocking, something that we are always exited to see.

再个7770都已经有1g的频率了,1075相对而言也算正常吧。。
而且按惯例,amd的型号十位数代表频率级别,百位数代表流处理器数量级别~
至于位宽区别也不用管了,刚好和esram的带宽相似也我觉得巧合而已,内存架构完全不同,应没什么关系的。。

如果想以单纯的带宽来逆推处理器计算能力的话,那么720的gpu还应该比7790更快才是,因为前者能达到13xgps
这个当然不是单纯d3的,是esram和d3在gpu满载时的合计带宽~

[ 本帖最后由 倍舒爽 于 2013-3-19 01:54 编辑 ]
作者: 你老闆    时间: 2013-3-19 02:21

引用:
原帖由 倍舒爽 于 2013-3-19 01:52 发表


这我就很不理解了,因为tom是这样写的。。
so much so that AMD has apparently asked manufacturers not to release overclocked versions of the card for fear of it surpassing and consequently cripplin ...
好吧你有道理,但他的確寫著7790OC,誰知道
作者: 倍舒爽    时间: 2013-3-19 02:26

转篇东西,挺有意思。。
gaf几位提到的100%cu利用率该不是空穴来风。。

Why is it important to measure it?

The latency of the main memory directly influences the efficiency of the GPU, thus its performance: reducing wait time can be more important than increasing execution speed. Unfortunately, memory has huge latency (today, by a factor of 100 or more): A GPU waiting for 100 clocks for data would run at 1/100 efficiency, i.e. 1% of theoretical performance!

Modern GPUs have internal "memory caches" that mirror instructions/data from main memory but at far lower latencies; they allow the GPU to get data much faster and thus increase efficiency. Unfortunately the faster the cache the smaller it needs to be, thus modern GPUs contain various cache hierarchy levels (L1, L2, L3) that get progressively bigger but slower.

Memory is not only differentiated by the speed it runs at (MHz) but also its type (e.g. DDR3, GDDR3, GDDR5, etc.) and also the timings (command latencies) it supports (e.g. tCAS/CL, tRP, tRCD, tRAS, etc.). The lower the timings the lower the overall latency of memory.

http://www.sisoftware.net/?d=qa&f=gpu_mem_latency
我那边需要爬墙才能看到全文。。否则只能看一半。。

[ 本帖最后由 倍舒爽 于 2013-3-19 02:30 编辑 ]
作者: KoeiSangokushi    时间: 2013-3-19 09:53

posted by wap, platform: iPhone
引用:
原帖由 @倍舒爽  于 2013-3-19 02:26 发表
转篇东西,挺有意思。。
gaf几位提到的100%cu利用率该不是空穴来风。。

Why is it important to measure it?

The latency of the main memory directly influences the efficiency of the GPU, thus its perf ...
求GAF提到100%利用率原
作者: vidya    时间: 2013-3-19 10:22

posted by wap, platform: Android

硬件什么都是浮云,微软还是管好自家东西的质量吧,再出个三红就笑大街了。
作者: shinkamui    时间: 2013-3-19 13:18

引用:
原帖由 倍舒爽 于 2013-3-19 02:26 发表
转篇东西,挺有意思。。
gaf几位提到的100%cu利用率该不是空穴来风。。

Why is it important to measure it?

The latency of the main memory directly influences the efficiency of the GPU, thus its perf ...
我一直在说对于现代显卡,存储器延迟方面的重要性,一直没人理解。

当然ms的新东西能在延迟上提升多少还是不知道,就算真的提升很多,怎么用好也是问题……等e3。
作者: 讴歌123    时间: 2013-3-19 13:32

引用:
原帖由 shinkamui 于 2013-3-19 13:18 发表

我一直在说对于现代显卡,存储器延迟方面的重要性,一直没人理解。

当然ms的新东西能在延迟上提升多少还是不知道,就算真的提升很多,怎么用好也是问题……等e3。
那为何老黄的旗舰卡Titan还是用6G GDDR5,不用GDDR3+ESRAM?

显然MS和SCE的出发点是不一样的,MS一开始设计720时就以8G RAM(容量)为目标,各方面权衡妥协之下用了DDR3+ESRAM。而SCE一开始设计PS4时就以统一内存GDDR5(带宽)为目标,最后不过是咬牙硬上了8G而已。

延迟不过是DDR3+ESRAM带来的一个侧面效应,MS主要考虑的还是成本。

[ 本帖最后由 讴歌123 于 2013-3-19 13:33 编辑 ]
作者: shinkamui    时间: 2013-3-19 13:34

引用:
原帖由 讴歌123 于 2013-3-19 13:32 发表

那为何老黄的旗舰卡Titan还是用6G GDDR5,不用GDDR3+ESRAM?

显然MS和SCE的出发点是不一样的,MS一开始设计720时就以8G RAM为目标,各方面权衡妥协之下用了DDR3+ESRAM。而SCE一开始设计PS4时就以统一内存GDDR5为 ...
硬件的改变必须要api的配合,上层api不改,下面硬件改了怎么用?看看ati多少年前就弄了硬件tesselation就知道了。
游戏机可没这个限制,所以xbox360就有dx11的硬件tesselation,halo wars,pinata都用的。

另外,通用计算对延迟的敏感程度远超过从前单纯图形计算,所以现在改价值更大。

[ 本帖最后由 shinkamui 于 2013-3-19 13:36 编辑 ]
作者: 讴歌123    时间: 2013-3-19 13:51

引用:
原帖由 shinkamui 于 2013-3-19 13:34 发表

硬件的改变必须要api的配合,上层api不改,下面硬件改了怎么用?看看ati多少年前就弄了硬件tesselation就知道了。
游戏机可没这个限制,所以xbox360就有dx11的硬件tesselation,halo wars,pinata都用的。

另外 ...
除非MS像当年把C1的Unified Shader定义为DX10标准一样,次世代强行把什么ESRAM、DME之类的玩意儿定义为PC高端显卡(例如DX12?)的标准,逼开发厂商针对720架构进行优化。不然除了MS第一方哪家第三方吃饱了撑着针对你这个特殊架构优化?PS4可基本上算纯PC架构!!!!参考对象Cell,本世代都结束了,也没见几家第三方针对Cell优化……
作者: shinkamui    时间: 2013-3-19 13:57

引用:
原帖由 讴歌123 于 2013-3-19 13:51 发表

除非MS像当年把C1的Unified Shader定义为DX10标准一样,次世代强行把什么ESRAM、DME之类的玩意儿定义为PC高端显卡(例如DX12?)的标准,逼开发厂商针对720架构进行优化。不然除了MS第一方哪家第三方吃饱了撑着针对 ...
降低延迟是所有高端开发商共同的心愿,有好东西不用那是自己跟自己过不去。这是游戏机不是电脑,做牛逼引擎的这几家必然是会充分利用好这一特性的。这玩意有什么用现在各家开发商可是非常清楚的。至于cell,cell在刚出来的时候大家知道这玩意有什么用么?其实cell不错但是离pc太远。720和普通pc的差异算40%,ps4就是15%,cell在当年看直接超过200%。就算在现在通用计算这么流行的情况下,cell仍然算异类。但即使如此,ps3上还是有第三方好好利用了cell不是么。

[ 本帖最后由 shinkamui 于 2013-3-19 14:00 编辑 ]
作者: 讴歌123    时间: 2013-3-19 14:08

引用:
原帖由 shinkamui 于 2013-3-19 13:57 发表

降低延迟是所有高端开发商共同的心愿,有好东西不用那是自己跟自己过不去。这是游戏机不是电脑,做牛逼引擎的这几家必然是会充分利用好这一特性的。这玩意有什么用现在各家开发商可是非常清楚的。至于cell,cell在 ...
你的说法必须建立在720的设计是MS听取了Epic和Crytek等牛逼引擎厂建议的前提下
作者: shinkamui    时间: 2013-3-19 14:13

引用:
原帖由 讴歌123 于 2013-3-19 14:08 发表

你的说法必须建立在720的设计是MS听取了Epic和Crytek等牛逼引擎厂建议的前提下
1. 就算没听,做过开发的都知道需要什么。你觉得制定了direct compute标准的ms自己会不知道现在的瓶颈在哪里?
2. 你怎么知道ms没听呢?尤其在上代360明显就是听了epic建议的情况下。
作者: 你老闆    时间: 2013-3-19 16:54

引用:
原帖由 讴歌123 于 2013-3-19 13:32 发表

那为何老黄的旗舰卡Titan还是用6G GDDR5,不用GDDR3+ESRAM?

显然MS和SCE的出发点是不一样的,MS一开始设计720时就以8G RAM(容量)为目标,各方面权衡妥协之下用了DDR3+ESRAM。而SCE一开始设计PS4时就以统一内 ...
如果ESRAM的size能降下來的話應該會有一堆旗艦卡用純SRAM,可能到時會叫GSRAM之類(貴點沒關係,反正旗艦不是拿來賺,是拿來show技術)
另外GDDR3和DDR3不同的

[ 本帖最后由 你老闆 于 2013-3-19 16:56 编辑 ]
作者: 你老闆    时间: 2013-3-19 16:57

引用:
原帖由 shinkamui 于 2013-3-19 14:13 发表

1. 就算没听,做过开发的都知道需要什么。你觉得制定了direct compute标准的ms自己会不知道现在的瓶颈在哪里?
2. 你怎么知道ms没听呢?尤其在上代360明显就是听了epic建议的情况下。
感覺微軟是起碼有聽Crytek的,畢竟他們一直在合作
Epic也有不小機會,但覺得這次可能聽Crytek的機會比較大,又或者兩家都聽,只要兩家的要求沒衝突

[ 本帖最后由 你老闆 于 2013-3-19 17:31 编辑 ]
作者: 倍舒爽    时间: 2013-3-19 17:25

引用:
原帖由 讴歌123 于 2013-3-19 13:32 发表

那为何老黄的旗舰卡Titan还是用6G GDDR5,不用GDDR3+ESRAM?

显然MS和SCE的出发点是不一样的,MS一开始设计720时就以8G RAM(容量)为目标,各方面权衡妥协之下用了DDR3+ESRAM。而SCE一开始设计PS4时就以统一内 ...
是的,我开始也是这样想的~
1.对于传统渲染的带宽诉求来说,df也认为esram+d3就是一个sticking plaster solution,
是在低成本下追逐gd5带宽的一个方案。。
并且fxaa的发明者也认为esram的配置在延迟渲染上有诸多瓶颈~

2.但后来根据shin兄的方向,自己找了点资料,这有不确定因素。。
gpgpu运算是未来。。
且amd最重要的任务是推广hsa,必须要找到一条出路和两家侧面竞争,传统的gpu,cpu已经没法战了~
但hsa除了硬件架构外,首要的是软件跟得上。。
但是amd的下游推广能力,普及能力乃至pr都无法和两家比较~差了n个档次,这个大家都懂得。。(我搜了一圈居然没有hsa的中文讲座)
opencl作为开源api却远落后于cuda的步伐就是一个例子~~
目前pc市面上的apu光有理念却无实际应用也是一个例子,,

那么目前最方便有效推hsa的方式便是从游戏机下手,也跟游戏机商的换代诉求不谋而合、、
那么综上所述,这里就涉及到新版本的dx架构以及标准的制定~ms自己也必须为未来的dx找一个gpgpu架构方案。。
我们目前的pc乃至移动终端应用也确是如此,99%的非游戏应用都不需要gpu,实则是很浪费的,就算有应用也不过是ui方面的加速罢了。。
想象一下以后开个网页都能利用到gpu真是蛮爽的。。
esram可能是以后pc架构的某种变种存在也不一定。。
别拿xo的edram做例子,这完全两码事呢。。

注意一点是,hsa的应用不是为了追求超高性能,而是为了追求超高效率~

以后的windows任务管理器可能除了有cpu占用显示外可能还有个gpu占用。。

所以这里产生一个amd和ms可能是他们史上最大的依存关系,这是sony和amd所没有的~
在这之下产生的硬件。。。我觉得不应该看得这么单纯的。。
另外hsaf还有个重要成员就是arm~

当然,今次sony也不是省油的灯,作为不是sony员工却是ps4的首席架构师mark cerny,能有这种特殊位置,只有神级人物才有资格~
有别于当年ps3以日本团队为基础而开发,过于超前判断图形应用的错误不会再犯了~

这里有个abc的hsa讲座,无字幕,基于本人那点知识水平和听力水准~只听了点皮毛。。
有兴趣可以看看:
http://api.viglink.com/api/click ... sonp_13636850756222

另外我再补充点小要素~
crytek社不是一次两次把ps720的规格置于一种不屑的态度~
但id反而很是肯定~这感觉有点微妙。。
作为两大拳头引擎商,我是这样理解的~
ps720的传统渲染能力还是满足不了ct的诉求,这也意味着ct在gpgpu方面的研究还是不足,哭引擎目前追求的还是究极的光栅化渲染方式。。
但是id就不是了,据我所知,id在很多年前(比rage出来时更早)就在通用计算式的渲染方面做了很大的研究,论文也发布了不少。。

nv似乎把目光看得更遥远,相对大家都搞终端的硬件架构,他都要搞云端超算阵列了~
毕竟以后大家的终端已经不需要性能了。。

[ 本帖最后由 倍舒爽 于 2013-3-19 17:42 编辑 ]
作者: 2006arg    时间: 2013-3-19 17:28

吹的再厉害,GPU就那个级别,也就是两个中低端显卡的水平。。。
作者: zlg5    时间: 2013-3-19 19:21     标题: 回复 85# 的帖子

mark cerny 何许人也?????
到底大神到什么程度?
作者: 首斩破沙罗    时间: 2013-3-19 19:39

引用:
原帖由 zlg5 于 2013-3-19 19:21 发表
mark cerny 何许人也?????
到底大神到什么程度?
http://baike.baidu.com/view/5806752.htm  看介绍是个牛逼的人物,但是我认为还没到大神的地步吧
作者: zlg5    时间: 2013-3-19 19:50     标题: 回复 88# 的帖子

ICE TEAM的主管啊 看来至少PS4 是以便于开发为前提设计的了。。。。
作者: zlg5    时间: 2013-3-19 19:50     标题: 回复 88# 的帖子

ICE TEAM的主管啊 看来至少PS4 是以便于开发为前提设计的了。。。。
作者: DVDRiP    时间: 2013-3-19 19:52

引用:
原帖由 首斩破沙罗 于 2013-3-19 19:39 发表

http://baike.baidu.com/view/5806752.htm  看介绍是个牛逼的人物,但是我认为还没到大神的地步吧
Insomniac Games日子还好过么?
作者: KoeiSangokushi    时间: 2013-3-19 19:55

引用:
原帖由 你老闆 于 2013-3-19 16:54 发表

如果ESRAM的size能降下來的話應該會有一堆旗艦卡用純SRAM,可能到時會叫GSRAM之類(貴點沒關係,反正旗艦不是拿來賺,是拿來show技術)
另外GDDR3和DDR3不同的
DDR3的延迟比GDDR3更低
作者: KoeiSangokushi    时间: 2013-3-19 20:11

引用:
原帖由 倍舒爽 于 2013-3-19 17:25 发表


是的,我开始也是这样想的~
1.对于传统渲染的带宽诉求来说,df也认为esram+d3就是一个sticking plaster solution,
是在低成本下追逐gd5带宽的一个方案。。
并且fxaa的发明者也认为esram的配置在延迟渲染上有 ...
ESRAM+DDR3是为了省钱接近GDDR5的效果?

拜托!XBOX360用的都是GDDR3,微软会穷的到次世代XBOX反而用带宽更小的DDR3?(同时代的GDDR3都比DDR3带宽要更高)

这也是为了追求低延迟!因为DDR3的延迟比GDDR3更低!(GDDR5的延迟比GDDR3更高)

次世代XBOX追求的就是终极的低延迟!

ESRAM在这里实际上就相当于GPU的L3缓存!

至于为什么要追求低延迟?这得问微软打算怎样制定下一代DX标准!

[ 本帖最后由 KoeiSangokushi 于 2013-3-19 20:14 编辑 ]
作者: west2046    时间: 2013-3-19 20:21

引用:
原帖由 KoeiSangokushi 于 2013-3-19 20:11 发表

ESRAM+DDR3是为了省钱接近GDDR5的效果?

拜托!XBOX360用的都是GDDR3,微软会穷的到次世代XBOX反而用带宽更小的DDR3?(同时代的GDDR3都比DDR3带宽要更高)

这也是为了追求低延迟!因为DDR3的延迟比GDDR3更低 ...
极端追求延迟牺牲机能,微软必须跪下
作者: 倍舒爽    时间: 2013-3-19 20:44

引用:
原帖由 KoeiSangokushi 于 2013-3-19 20:11 发表

ESRAM+DDR3是为了省钱接近GDDR5的效果?

拜托!XBOX360用的都是GDDR3,微软会穷的到次世代XBOX反而用带宽更小的DDR3?(同时代的GDDR3都比DDR3带宽要更高)

这也是为了追求低延迟!因为DDR3的延迟比GDDR3更低 ...
gd3和dd3.。

无力吐槽,你自己查查看为什么不可能用gd3吧。。
作者: KoeiSangokushi    时间: 2013-3-19 20:54

引用:
原帖由 倍舒爽 于 2013-3-19 20:44 发表


gd3和dd3.。

无力吐槽,你自己查查看为什么不可能用gd3吧。。
我查不出来
作者: 倍舒爽    时间: 2013-3-19 21:08

今时今日你去各大颗粒提供商看看还有生产gd3的?就算有产量肯定超少~

电气性能,同频下发热更低~

延迟,d3是由gd3发展过来的适应cpu的低延迟版本

gd3的带宽比d3要大?
我见过最高频的gd3为2ghz,而d3已经有2.8ghz~



[ 本帖最后由 倍舒爽 于 2013-3-19 21:10 编辑 ]
作者: KoeiSangokushi    时间: 2013-3-19 21:11

引用:
原帖由 倍舒爽 于 2013-3-19 21:08 发表
今时今日你去各大颗粒提供商看看还有生产gd3的?就算有产量肯定超少~

电气性能,同频下发热更低~

延迟,d3是由gd3发展过来的适应cpu的低延迟版本

gd3的带宽比d3要大?
我见过最高频的gd3为2ghz,而d3已经有 ...
那是因为GDDR5直接接过了GDDR3的棒
同期的GDDR3都比DDR3带宽高,延迟高
所以XBOX360使用GDDR3而不是DDR3
而GDDR5可以看作是GDDR3实质上的后续者

另外2008年那阵子GDDR3跑在2200MHz频率的很常见
诸如蓝宝石HD4850 TOXIC和耕升HD4850赵云版等等
2009年的GTX285的GDDR3更是跑到了2484MHz之高(这还是建立在NVIDIA的显存控制器技术落后的基础上,实际上GTX285用的0.7纳秒GDDR3自身频率能到2866MHz,注意这只是2009年的GDDR3)

而XBOX次世代传闻用的不过是2133MHz的DDR3而已

一厢情愿认为微软是太穷/技术太差用不起/用不来GDDR5才用ESRAM和DDR3的都是什么心态。。。
某人总是说我带了太多的个人感情色彩,我倒是觉得事实恰恰相反~

[ 本帖最后由 KoeiSangokushi 于 2013-3-19 21:27 编辑 ]
作者: XBOX720来临    时间: 2013-3-19 21:27

话说延迟在实际游戏效果上主要体现在哪些方面?

MS这么注重延迟肯定是有自己的战略原因的.
作者: 倍舒爽    时间: 2013-3-19 21:27

引用:
原帖由 KoeiSangokushi 于 2013-3-19 21:11 发表

那是因为GDDR5直接接过了GDDR3的棒
同期的GDDR3都比DDR3带宽高,延迟高
所以XBOX360使用GDDR3而不是DDR3
而GDDR5可以看作是GDDR3实质上的后续者

另外2008年那阵子GDDR3跑在2200MHz频率的很常见
诸如蓝宝石H ...
其他无意见。。
但xo那个年代也就是05年就有d3卖了??有d3能用了??
05年你就用上d3了?

上面那个图没看见么?d3比gd3更便宜!

别说同期不同期,就算有更高频。。也是过去式~
光说极限状态下的频率又什么意思呢?成本,散热全不考虑了??这些都是钱!

今天的同期实际状况就是从颗粒商的产品显示gd3频率不如d3。。
是淘汰产品没什么生产,又更贵~又更热。。。

带宽的折衷方式我是照般df那话说的。。和讴歌123的理解一样,容量就是服务,容量为先!
其他一切围绕容量来寻求方案。。
作者: KoeiSangokushi    时间: 2013-3-19 21:29

引用:
原帖由 倍舒爽 于 2013-3-19 21:27 发表


其他无意见。。
但xo那个年代也就是05年就有d3卖了??有d3能用了??
05年你就用上d3了?

上面那个图没看见么?d3比gd3更便宜!

别说同期不同期,就算有更高频。。也是过去式~
光说极限状态下的频率又 ...
对,2008年999的中端卡都能上2200MHz的GDDR3
随着技术的不断退步,那只是“过去式”了,GDDR3已经只能用1600MHz的频率了
是不是这个道理?

[ 本帖最后由 KoeiSangokushi 于 2013-3-19 21:30 编辑 ]




欢迎光临 TGFC Lifestyle (http://bbs.tgfcer.com/) Powered by Discuz! 6.0.0