Board logo

标题: [新闻] 巨硬的神秘力量:X1的ESRAM理论带宽从102GB/s飙升88%至192GB/s [打印本页]

作者: 讴歌123    时间: 2013-6-28 22:11     标题: 巨硬的神秘力量:X1的ESRAM理论带宽从102GB/s飙升88%至192GB/s

http://www.eurogamer.net/article ... production-hardware

The 32MB of "embedded static RAM" within the Xbox One processor aims to make up the difference, and was previously thought to sustain a peak theoretical throughput of 102GB/s - useful, but still some way behind the 176GB/s found in PlayStation 4's RAM set-up. Now that close-to-final silicon is available, Microsoft has revised its own figures upwards significantly, telling developers that 192GB/s is now theoretically possible.

显卡频率还是800MHz,CPU也还是1.6GHz

我硬件小白,具体怎么回事你们还是去看DF的分析吧:D :D :D
作者: cgyldn    时间: 2013-6-28 22:13

喝了加林仙人的超圣水…?
作者: tommyshy    时间: 2013-6-28 22:18

科幻片
作者: QuiGon    时间: 2013-6-28 22:25

老实说,就这两台主机的破性能,居然还有人给洗地,实在是不知道脑子里想些什么。

带宽再少再多,GPU再弱再强,关你毛事啊???你又不懂编程。老老实实玩不就得了么!!!
作者: 便腥惊肛    时间: 2013-6-28 22:33

终于成功的拔千斤了?
作者: 塌方    时间: 2013-6-28 22:35

同样的变身我还能进行两次!!!
作者: KoeiSangokushi    时间: 2013-6-28 22:36

posted by wap, platform: Chrome

跑去EUROGAMER看了下,简单的说就是,之前微软没解决读写同时进行的技术问题,压低了提供给开发者的ESRAM带宽参数,但是后来微软找到了同时进行读写的方法,所以ESRAM的带宽飙升
作者: 倍舒爽    时间: 2013-6-28 22:39

posted by wap, platform: iPhone

马克回去看科学
作者: 动感操人    时间: 2013-6-28 22:43

posted by wap, platform: ZTE (U985)
引用:
原帖由 @塌方  于 2013-6-28 22:35 发表
同样的变身我还能进行两次!!!
233333333
作者: tommyshy    时间: 2013-6-28 22:46

简单说就是你有科技,我有神功?
作者: zafm0861    时间: 2013-6-28 22:48

theoretically possible.

理论上可以
至于实用方面未知
作者: 爱你一棒陲    时间: 2013-6-28 22:49

esram本来就有额外的102GB带宽,超频咩?
作者: 你老闆    时间: 2013-6-28 22:51

引用:
原帖由 zafm0861 于 2013-6-28 22:48 发表
theoretically possible.

理论上可以
至于实用方面未知
給的數字一向是峰值數字(無論192,102,176,68),肯定不會長期處於這個運行狀態,即使遊戲中
作者: cynic0522    时间: 2013-6-28 22:51

SONY完蛋了。
作者: KoeiSangokushi    时间: 2013-6-28 22:52

引用:
原帖由 你老闆 于 2013-6-28 22:51 发表

給的數字一向是峰值數字(無論192,102,176,68),肯定不會長期處於這個運行狀態,即使遊戲中
带宽无所谓峰值谷值
作者: 爱你一棒陲    时间: 2013-6-28 22:55

turbo boost?
作者: 你老闆    时间: 2013-6-28 22:59

引用:
原帖由 KoeiSangokushi 于 2013-6-28 22:52 发表

带宽无所谓峰值谷值
那就是看開發商的利用率了吧?
作者: KoeiSangokushi    时间: 2013-6-28 23:01

posted by wap, platform: Chrome
引用:
原帖由 @你老闆  于 2013-6-28 22:59 发表
那就是看開發商的利用率了吧?
利用多少和带宽是多少是两码事

好比班车,不管你搭乘不搭乘,它都按照规定的发车频率和发车数量在跑(除非是桌面模式为了省电降频,但是这不关游戏的事)
作者: 你老闆    时间: 2013-6-28 23:03

引用:
原帖由 KoeiSangokushi 于 2013-6-28 23:01 发表
posted by wap, platform: Chrome

利用多少和带宽是多少是两码事

好比班车,不管你搭乘不搭乘,它都按照规定的发车频率和发车数量在跑(除非是桌面模式为了省电降频,但是这不关游戏的事)
那192就是192了吧?
作者: KoeiSangokushi    时间: 2013-6-28 23:04

posted by wap, platform: Chrome
引用:
原帖由 @你老闆  于 2013-6-28 23:03 发表
那192就是192了吧?
报道的是192,如果报道为真,那就是192
作者: DarthVadar    时间: 2013-6-28 23:10

posted by wap, platform: iPhone

也就拨了500斤吧最后还是说性能有差距只是很可能初期显现不出
作者: 來福時代    时间: 2013-6-28 23:50

posted by wap, platform: Firefox

圣光显灵,祖坟冒烟,这次赢定了!
作者: wpxgod    时间: 2013-6-29 00:05

这是理论带宽  但是实际应用的时候因为数据的不同跟大小  肯定达不到理论值的  

按这篇的翻译   实际运作也比原来的提高 30% 达到 133GB/s。
http://www.xbox-skyer.com/conten ... B%98%E5%88%B0-192GB
作者: BlackGod    时间: 2013-6-29 00:32

蛮可怜的
作者: seek    时间: 2013-6-29 00:48

大sony底牌亮光了?没有隐藏参数可爆料了?
作者: BlackGod    时间: 2013-6-29 01:07

喷了 原来是读写加起来192GB 那实际gpu频率=96GB/128bit=750MHz 比原先800少了50MHz ms自黑?
作者: 1320581    时间: 2013-6-29 02:11

引用:
原帖由 wpxgod 于 2013-6-29 00:05 发表
这是理论带宽  但是实际应用的时候因为数据的不同跟大小  肯定达不到理论值的  

按这篇的翻译   实际运作也比原来的提高 30% 达到 133GB/s。
http://www.xbox-skyer.com/content.php?r=3785-%E5%BE%AE%E8%BD%AF% ...
ps4的176GB/s也是理论带宽,实际肯定也达不到。
作者: 倍舒爽    时间: 2013-6-29 02:20

引用:
原帖由 wpxgod 于 2013-6-29 00:05 发表
这是理论带宽  但是实际应用的时候因为数据的不同跟大小  肯定达不到理论值的  

按这篇的翻译   实际运作也比原来的提高 30% 达到 133GB/s。
http://www.xbox-skyer.com/content.php?r=3785-%E5%BE%AE%E8%BD%AF% ...
“文章中提到疑问,Killzone: Shadow Fall 那样将 800MB 内存独立用作渲染物体的做法,Xbox One 上的 32MB eSRAM 有什么办法实现类似的功能呢?现在第一方游戏在 E3 表现的事实已经说明,DF 似乎不了解 eSRAM 高速缓存在 Xbox One 架构的运用细节和开发工具中的实现方法。”

等等,这文居然是狗康翻译的??
他作为业内,也译得太业余了吧,不是说文字翻译水平,而是对图形技术方面的理解程度。。

这显然是和deferredrendering的gbuffer有关。。

[ 本帖最后由 倍舒爽 于 2013-6-29 02:25 编辑 ]
作者: 1320581    时间: 2013-6-29 02:25

引用:
原帖由 倍舒爽 于 2013-6-29 02:20 发表


等等,这文居然是狗康翻译的??
作为业内,也译得太业余了吧,不是说文字翻译水平,而是对技术方面的理解程度。。
如果频率是800的话,ESRAM带宽应该是204GB/s,为什么是192GB/s?

[ 本帖最后由 1320581 于 2013-6-29 02:43 编辑 ]
作者: 你老闆    时间: 2013-6-29 02:43

引用:
原帖由 BlackGod 于 2013-6-29 01:07 发表
喷了 原来是读写加起来192GB 那实际gpu频率=96GB/128bit=750MHz 比原先800少了50MHz ms自黑?
To the best of their knowledge, 800MHz remains the clock speed of the graphics component of the processor, and the main CPU is operating at the target 1.6GHz. In both respects, this represents parity with the PlayStation 4.
作者: 你老闆    时间: 2013-6-29 02:56

引用:
原帖由 1320581 于 2013-6-29 02:25 发表

如果频率是800的话,ESRAM带宽应该是204GB/s,为什么是192GB/s?
Apparently, there are spare processing cycle "holes" that can be utilised for additional operations

其實360的EDRAM也差不多情況啊

[ 本帖最后由 你老闆 于 2013-6-29 03:08 编辑 ]
作者: shigeru    时间: 2013-6-29 03:04

posted by wap, platform: Android

你们都高科技
作者: lkig    时间: 2013-6-29 06:59

Apparently, there are spare processing cycle "holes" that can be utilised for additional operations. Theoretical peak performance is one thing, but in real-life scenarios it's believed that 133GB/s throughput has been achieved with alpha transparency blending operations (FP16 x4).

前面有人說理論頻寬就是可以達到的實際頻寬,理論上是沒錯
但是微軟ESRAM這個192GB意義上跟我們一般的理論頻寬並不同
DDR3 GDDR5的理論頻寬就是指一次可以達到的最大資料量
微軟的作法是利用處理時間等待的時候可以去做其他讀寫動作
所以理論上是192GB但實際運用上的最高頻寬只有133GB
但是利用讀寫同時進行的這種算法最高頻寬依然是102GB
差別只是同時處理的資料流量可以到133GB,但是GPU一次往返的資料流量依然是102GB

Apparently, there are spare processing cycle "holes" that can be utilised for additional operations. Theoretical peak performance is one thing
比較有趣的是....各位有沒有發現這個能力其實是建立在GPU讓ESRAM去等的時間發揮出來的能力????
還是那句老話~~~~除非換GPU架構,不然ESRAM要發揮低延遲的能力實在很難
作者: 你老闆    时间: 2013-6-29 07:14

Everyone is developer,suddenly
作者: west2046    时间: 2013-6-29 08:07

引用:
原帖由 DarthVadar 于 2013-6-28 23:10 发表
posted by wap, platform: iPhone

也就拨了500斤吧最后还是说性能有差距只是很可能初期显现不出
文章说,虽然现在PS4的游戏表现没有ONE好(索饭对这个不承认吧),虽然PS4的内存延迟严重,虽然PS4的音效芯片可能消耗内存和CPU,但是ONE的DDR3带宽不行,高速缓存即使可以到192GB/S容量不够,硬件参数不行,但开发好套件好了以后(索饭对这个不承认吧),PS4会超过ONE
作者: lkig    时间: 2013-6-29 08:22

引用:
原帖由 你老闆 于 2013-6-29 07:14 发表
Everyone is developer,suddenly
看的懂數據跟原理跟是不是開發者完全兩碼事~~~~
記憶體存取這方面的原理其實很久沒有大進展了基本上都是一直疊床架屋下去
跟GPU一代變革過一代相去甚遠矣~~~~

文章最後還有提到GDDR5的高延遲可能對PS4的CPU有影響~~~~
不過CPU的延遲主要還是看自己的快取怎麼去緩衝比較重要吧~~~~
作者: freesound7910    时间: 2013-6-29 08:37

这还没算三倍界王拳呢。。。。
大微软血洗DDR5  统一全球 指日可待
作者: solarx    时间: 2013-6-29 08:47

is now theoretically possible

嗯哼
作者: KoeiSangokushi    时间: 2013-6-29 08:51

引用:
原帖由 lkig 于 2013-6-29 06:59 发表
Apparently, there are spare processing cycle "holes" that can be utilised for additional operations. Theoretical peak performance is one thing, but in real-life scenarios it's believed that 133GB/s th ...
你搞错了,133GB/S只是文章随便列举某一种带宽超过102GB/S时的用法而已
ESRAM支持192GB/S的用法
并不是最高仅支持133GB/S——如果真是这样,那文章也就不会提什么192GB/S了
作者: 倍舒爽    时间: 2013-6-29 08:53

引用:
原帖由 lkig 于 2013-6-29 06:59 发表
Apparently, there are spare processing cycle "holes" that can be utilised for additional operations. Theoretical peak performance is one thing, but in real-life scenarios it's believed that 133GB/s th ...
也就是说gpu频率就显得非常重要了,哪怕提升50mhz,都能带来非常可观的收入。。。
作者: KoeiSangokushi    时间: 2013-6-29 08:53

引用:
原帖由 lkig 于 2013-6-29 08:22 发表


看的懂數據跟原理跟是不是開發者完全兩碼事~~~~
記憶體存取這方面的原理其實很久沒有大進展了基本上都是一直疊床架屋下去
跟GPU一代變革過一代相去甚遠矣~~~~

文章最後還有提到GDDR5的高延遲可能對PS4的CPU ...
PS4的CPU还能怎样缓存?CPU都是一样的美洲豹,一样的缓存规格
反倒是X1的CPU可以通过GPU利用到ESRAM做缓存(理论上)
作者: KoeiSangokushi    时间: 2013-6-29 08:55

引用:
原帖由 倍舒爽 于 2013-6-29 08:53 发表


也就是说gpu频率就显得非常重要了,哪怕提升50mhz,都能带来非常可观的收入。。。
不是这个概念的,频率、位宽都没变
变的是ESRAM的用法(同时读写、只读不写、只写不读等等情况都是不同的)
作者: 倍舒爽    时间: 2013-6-29 08:59

引用:
原帖由 KoeiSangokushi 于 2013-6-29 08:55 发表

不是这个概念的,频率、位宽都没变
变的是ESRAM的用法(同时读写、只读不写、只写不读等等情况都是不同的)
我的意思是建立在它的说法上的,这些硬性东西当然不可能会变。。
因为频率一上去,那么esram的等待机会就会增多,哪怕频率只上去那么一点。。

另外细看原文措辞,它这个理论上带宽和咱们常规上的理论带宽的确不是一回事。。

[ 本帖最后由 倍舒爽 于 2013-6-29 09:00 编辑 ]
作者: KoeiSangokushi    时间: 2013-6-29 09:00

引用:
原帖由 倍舒爽 于 2013-6-29 08:59 发表


我的意思是建立在它的说法上的,这些硬性东西当然不可能会变。。
因为频率一上去,那么esram的等待机会就会增多,哪怕频率只上去那么一点。。
50亿晶体管了,CPU的频率都压低到1.6GHz了,GPU的800MHz要是再高,估计要烧了
作者: 小僵尸    时间: 2013-6-29 09:03

引用:
原帖由 KoeiSangokushi 于 2013-6-29 08:55 发表

不是这个概念的,频率、位宽都没变
变的是ESRAM的用法(同时读写、只读不写、只写不读等等情况都是不同的)
也就是同时读写,最大数据吞吐是2倍理论带宽
其他纯读取,纯写入这个是不存在的
作者: madrista7    时间: 2013-6-29 09:05

60fps vs 30fps?

作者: 小僵尸    时间: 2013-6-29 09:07

引用:
原帖由 west2046 于 2013-6-29 08:07 发表

文章说,虽然现在PS4的游戏表现没有ONE好(索饭对这个不承认吧),虽然PS4的内存延迟严重,虽然PS4的音效芯片可能消耗内存和CPU,但是ONE的DDR3带宽不行,高速缓存即使可以到192GB/S容量不够,硬件参数不行,但开发 ...
音频部分有什么好谈的,PS3要不是为了统一和兼容,游戏支持DTS-HA和TRUEHD的实时输出7.1都可以
难道到了PS4难道还有担心这种资源分配问题,这是开历史的倒车还是咸吃萝卜淡操心
作者: KoeiSangokushi    时间: 2013-6-29 09:11

引用:
原帖由 小僵尸 于 2013-6-29 09:07 发表


音频部分有什么好谈的,PS3要不是为了统一和兼容,游戏支持DTS-HA和TRUEHD的实时输出7.1都可以
难道到了PS4难道还有担心这种资源分配问题,这是开历史的倒车还是咸吃萝卜淡操心
EUROGAMER只是陈述一下客观事实,不管要占多少资源,总归要占,X1可是有独立音频芯片的
作者: 小僵尸    时间: 2013-6-29 09:20

PS4研发团队的另一个工作重点是将很多基本功能分配到专门的运算单元中,这样就不需要分配资源以处理这些事物,从而提高了主机的灵活性。比如,为音效处理准备专门的硬件单元,这样在游戏内同时进行语音聊天就无需占用游戏的资源。同理还有视频压缩和解压。另外音频单元还负责处理游戏中大量的MP3数据流的解压。

连PS3这种内存匮乏的机器在音视频处理上都不是大问题,PS4上没道理成为问题的.
作者: AngryMulch    时间: 2013-6-29 09:27

就算是这样,其实Xone性能还是没有优势啊

他那个196带宽其实也就对应32MB的esram而已

对外带宽仍是硬伤啊

有一种游戏对这这种架构比较有助益,例如任天堂的大乱斗,因为每一祯的数据重复率很高
作者: AngryMulch    时间: 2013-6-29 09:31

恭喜Xone又追近一点点性能差距,

真的只有"一点点"
作者: KoeiSangokushi    时间: 2013-6-29 09:31

posted by wap, platform: Chrome
引用:
原帖由 @小僵尸  于 2013-6-29 09:20 发表
PS4研发团队的另一个工作重点是将很多基本功能分配到专门的运算单元中,这样就不需要分配资源以处理这些事物,从而提高了主机的灵活性。比如,为音效处理准备专门的硬件单元,这样在游戏内同时进行语音聊天就无需占用游戏的资源。同理还有视频压缩和解压。另外音频单元还负责处理游戏中大量的MP3数据流的解压。

连PS3这种内存匮乏的机器在音视频处理上都不是大问题,PS4上没道理成为问题的.
不一样啊,PS3用的单独的内存,对音频的利用不影响显存
PS4这回是统一内存(准确的说是拿显存当内存),而且只有这一个内存,当然要占据一部分带宽和性能(不管实际影响有多小,人家EUROGAMER只是陈述事实而已)
X1有一个ESRAM作为“显存”,相对独立一些

本帖最后由 KoeiSangokushi 于 2013-6-29 09:33 通过手机版编辑
作者: AngryMulch    时间: 2013-6-29 09:34

就算这可怜的32MB esram带宽200以上还是沒有优势的

而且对编程来说相对麻烦

[ 本帖最后由 AngryMulch 于 2013-6-29 10:23 编辑 ]
作者: KoeiSangokushi    时间: 2013-6-29 09:35

posted by wap, platform: Chrome
引用:
原帖由 @AngryMulch  于 2013-6-29 09:34 发表
就算这可怜的32MB esram带宽200以上还是还有优势的

而且对编程来说相对麻烦
微软刚推出的DX11.2就是通过API更新的形式,解决了对ESRAM利用中编程麻烦的问题
作者: 小僵尸    时间: 2013-6-29 09:51

这和内存独立与否有什么关系

PS系的机器从PS1开始,音视频这块就是独立模块化的

就算是PC应用了,独立声卡和独立的视频编辑卡你看看能占用什么性能资源

除非PS4的音视频是依靠CPU软解的

不然单独提出来讨论没有什么意义
作者: BlackGod    时间: 2013-6-29 11:12

引用:
原帖由 你老闆 于 2013-6-29 02:43 发表

To the best of their knowledge, 800MHz remains the clock speed of the graphics component of the processor, and the main CPU is operating at the target 1.6GHz. In both respects, this represents parit ...
To the best of their knowledge
ms当然不会告诉他们降频了 我不清楚内存带宽是否能把读写加起来算 就算可以 原来是102 那也该是102X2=204 怎么才192?
老外有个解释
Right, that 204 is the theoretical max if they could just read and write wherever they wanted on every clock cycle. A real-world 133 GB/s would be much more realistic.
However, they gave 192 GB/s as a theoretical max. If this is the accurate figure, there are precisely two possibilities why:
1-The methodology they use to simultaneously read and write to the eSRAM is mathematically proven to work, at best, on ~8/9 clock cycles. This would explain the 1.88 factor of increase, as even in a perfect world you could not double the bandwidth.
2-The theoretical max assumes with perfect optimization read/write is always possible, but the GPU has been downclocked 50 MHz so the bandwidth in each direction is now 96 GB/s.
The first scenario is less likely, imo, because 8/9 is a really weird ratio for a binary system. Also, there is very rarely a reason to do anything but double the max rate of theoretical access if you discover sometimes simultaneous read/write is possible. In theory, one should be able to read and write completely separate memory adresses exclusively, which would truly double the rate.
I am not an expert, and the article may not be accurate, but this sure looks a lot like a downclock.
作者: KoeiSangokushi    时间: 2013-6-29 11:14

posted by wap, platform: Chrome
引用:
原帖由 @BlackGod  于 2013-6-29 11:12 发表
To the best of their knowledge
ms当然不会告诉他们降频了 我不清楚内存带宽是否能把读写加起来算 就算可以 原来是102 那也该是102X2=204 怎么才192?
老外有个解释
Right, that 204 is the theoretical max if they could just read and write wherever they wanted on every clock cycle. A realworld 133 GB/s would be much more realistic.
However, they gave 192 GB/s as a theoretical max. If this is the accurate figure, there are precisely two possibilities why:
1The methodology they use to simultaneously read and write to the eSRAM is mathematically proven to work, at best, on ~8/9 clock cycles. This would explain the 1.88 factor of increase, as even in a perfect world you could not double the bandwidth.
2The theoretical max assumes with perfect optimization read/write is always possible, but the GPU has been downclocked 50 MHz so the bandwidth in each direction is now 96 GB/s.
The first scenario is less likely, imo, because 8/9 is a really weird ratio for a binary system. Also, there is very rarely a reason to do anything but double the max rate of theoretical access if you discover sometimes simultaneous read/write is possible. In theory, one should be able to read and write completely separate memory adresses exclusively, which would truly double the rate.
I am not an expert, and the article may not be accurate, but this sure looks a lot like a downclock.
两种可能,一种是降频到750MHz,读写都达到96GB/S
另一种可能,不降频,192GB/S是说读写不能都达到102GB/S,比如读达到102GB/S了,写就只能90GB/S了

本帖最后由 KoeiSangokushi 于 2013-6-29 11:14 通过手机版编辑
作者: madrista7    时间: 2013-6-29 11:16

posted by wap, platform: Android

文中的带宽在最理想的环境也不可能达到
我看了看外站的一些文章和评论,感觉是gpu降频了50mhz,然后不好交代啊,工程师想了个理论上同时读写的概念来掩盖这个事实
作者: madrista7    时间: 2013-6-29 11:18

posted by wap, platform: Android
引用:
原帖由 @KoeiSangokushi  于 2013-6-29 11:14 发表
posted by wap, platform: Chrome

两种可能,一种是降频到750MHz,读写都达到96GB/S
另一种可能,不降频,192GB/S是说读写不能都达到102GB/S,比如读达到102GB/S了,写就只能90GB/S了

本帖最后由 KoeiSangokushi 于 2013629 11:14 通过手机版编辑  
肯定是降频了唉
作者: KoeiSangokushi    时间: 2013-6-29 11:19

posted by wap, platform: Chrome
引用:
原帖由 @madrista7  于 2013-6-29 11:18 发表
posted by wap, platform: Android

肯定是降频了唉
如果没降频你打算怎么办?
作者: madrista7    时间: 2013-6-29 11:21

posted by wap, platform: Android
引用:
原帖由 @KoeiSangokushi  于 2013-6-29 11:19 发表
posted by wap, platform: Chrome

如果没降频你打算怎么办?
哈哈想得糟糕点还可能有惊喜不是吗?
作者: KoeiSangokushi    时间: 2013-6-29 11:22

posted by wap, platform: Chrome
引用:
原帖由 @madrista7  于 2013-6-29 11:21 发表
posted by wap, platform: Android

哈哈想得糟糕点还可能有惊喜不是吗?
没什么惊喜不惊喜的,反正GPU浮点能力差33%
关键看开发商的优化水平
作者: BlackGod    时间: 2013-6-29 11:35

引用:
原帖由 KoeiSangokushi 于 2013-6-29 11:14 发表
posted by wap, platform: Chrome

两种可能,一种是降频到750MHz,读写都达到96GB/S
另一种可能,不降频,192GB/S是说读写不能都达到102GB/S,比如读达到102GB/S了,写就只能90GB/S了

本帖最后由 KoeiSangokushi ...
没可能像你说的这样工作 只能除以2 这是二进制系统
另外 按照我的理解 内存应该是独占的 怎么可能读写同时进行 这会引起内存泄露
作者: KoeiSangokushi    时间: 2013-6-29 11:39

posted by wap, platform: Chrome
引用:
原帖由 @BlackGod  于 2013-6-29 11:35 发表
没可能像你说的这样工作 只能除以2 这是二进制系统
另外 按照我的理解 内存应该是独占的 怎么可能读写同时进行 这会引起内存泄露
也许ESRAM这类静态内存情况不同吧
作者: 1320581    时间: 2013-6-29 11:44

索饭巴不得频率降到0,这样ps4好一统宇宙:D
作者: KoeiSangokushi    时间: 2013-6-29 11:46

posted by wap, platform: Chrome
引用:
原帖由 @1320581  于 2013-6-29 11:44 发表
索饭巴不得频率降到0,这样ps4好一统宇宙:D
说到点子上了
作者: madrista7    时间: 2013-6-29 11:51

posted by wap, platform: Android
引用:
原帖由 @BlackGod  于 2013-6-29 11:35 发表
没可能像你说的这样工作 只能除以2 这是二进制系统
另外 按照我的理解 内存应该是独占的 怎么可能读写同时进行 这会引起内存泄露
SRAM有dual-rate i/o,可以在一个时钟里同时读写
作者: KoeiSangokushi    时间: 2013-6-29 12:01

posted by wap, platform: Chrome
引用:
原帖由 @madrista7  于 2013-6-29 11:51 发表
posted by wap, platform: Android

SRAM有dualrate i/o,可以在一个时钟里同时读写
感觉GPU可能有确实降频到750MHz了,这样一来,浮点进一步缩到1.15T,跟PS4的1.84T差距又会拉大
不过微软能解决同时读写的问题,增大带宽到192GB/S,也算利大于弊了
作者: ylgtx    时间: 2013-6-29 12:02

一般说这话的都是自家机能不行的
作者: BlackGod    时间: 2013-6-29 12:03

引用:
原帖由 1320581 于 2013-6-29 11:44 发表
索饭巴不得频率降到0,这样ps4好一统宇宙:D
软饭恨不得数学公式出错?喷了
作者: lkig    时间: 2013-6-29 12:27

引用:
原帖由 KoeiSangokushi 于 2013-6-29 08:51 发表

你搞错了,133GB/S只是文章随便列举某一种带宽超过102GB/S时的用法而已
ESRAM支持192GB/S的用法
并不是最高仅支持133GB/S——如果真是这样,那文章也就不会提什么192GB/S了
Theoretical peak performance is one thing, but in real-life scenarios it's believed that 133GB/s throughput has been achieved with alpha transparency blending operations (FP16 x4).

閣下可以自己翻翻看這段~~~~~

這是這位開發者自己說的~~~~
理論的192GB上是一回事
實際使用上可能用到的是133GB
只是說明理論上頻寬的話就不會用is one thing, but in real-life
這樣的說詞了

according to sources who have been briefed by Microsoft, the original bandwidth claim derives from a pretty basic calculation - 128 bytes per block multiplied by the GPU speed of 800MHz offers up the previous max throughput of 102.4GB/s. It's believed that this calculation remains true for separate read/write operations from and to the ESRAM

還有這段~~~
ESRAM的讀寫頻寬依然是102GB,這個硬體數值實際上也沒有變大
只是利用ESRAM等資料的間隙來同時作讀寫的動作
同樣的技術SONY以前也說過用XDR同時寫入可以達到超過25.6GB的頻寬
只是實用性高低的問題

[ 本帖最后由 lkig 于 2013-6-29 12:55 编辑 ]
作者: lkig    时间: 2013-6-29 12:35

引用:
原帖由 KoeiSangokushi 于 2013-6-29 08:53 发表

PS4的CPU还能怎样缓存?CPU都是一样的美洲豹,一样的缓存规格
反倒是X1的CPU可以通过GPU利用到ESRAM做缓存(理论上)
CPU緩存????
就跟一般PC一樣啊~~~
這邊就要靠美洲豹自己了~~
難道你指望主記憶體來幫你做緩存????


X1的CPU透過ESRAM緩存????
ESRAM是接在GPU上的耶~~~~
你要這樣搞一樣要過DDR3這樣延遲不就又更大了????
再說ESRAM還是比CPU上的快取延遲高多了
就算把他接在CPU上也是於事無補~~~~~
作者: 倍舒爽    时间: 2013-6-29 12:50

posted by wap, platform: iPhone
引用:
原帖由 @madrista7  于 2013-6-29 11:18 发表
posted by wap, platform: Android

肯定是降频了唉
根本就没有降频!再看看原文,老外也是人罢了
作者: 变色龙    时间: 2013-6-29 13:10

PS4怎么不降频?微软用了什么火星技术出了这么多问题。。。
现在看来ESRAM变成了潘多拉魔盒了?各种问题接踵而至?
作者: 你老闆    时间: 2013-6-29 13:31

引用:
原帖由 BlackGod 于 2013-6-29 11:12 发表

To the best of their knowledge
ms当然不会告诉他们降频了 我不清楚内存带宽是否能把读写加起来算 就算可以 原来是102 那也该是102X2=204 怎么才192?
老外有个解释
Right, that 204 is the theoretical max i ...
痴線,開發者又不是普通玩家,怎可能不告訴他們?
To the best of their knowledge指的可是開發者

[ 本帖最后由 你老闆 于 2013-6-29 13:42 编辑 ]
作者: KoeiSangokushi    时间: 2013-6-29 13:41

posted by wap, platform: Chrome
引用:
原帖由 @变色龙  于 2013-6-29 13:10 发表
PS4怎么不降频?微软用了什么火星技术出了这么多问题。。。
现在看来ESRAM变成了潘多拉魔盒了?各种问题接踵而至?
ESRAM目前有什么问题?还接踵而至?
GPU降频现在也没有定论,你就这么肯定一定降了?
作者: 你老闆    时间: 2013-6-29 13:43

引用:
原帖由 KoeiSangokushi 于 2013-6-29 13:41 发表
posted by wap, platform: Chrome

ESRAM目前有什么问题?还接踵而至?
GPU降频现在也没有定论,你就这么肯定一定降了?
不用定論啊,沒降過,18號時都有人說了(他還去GAF看過傳聞帖lol)
https://twitter.com/XboxP3/status/346903798582763520
@JuanCabrera No downgrading of power, I've seen same rumor, not sure where that comes from.  Feeling good about visuals at E3 from kits.
作者: madrista7    时间: 2013-6-29 13:44

引用:
原帖由 倍舒爽 于 2013-6-29 12:50 发表
posted by wap, platform: iPhone

根本就没有降频!再看看原文,老外也是人罢了
DF原文确实没有说,但是如果没降频,不符合192GB的带宽数,DF也没去追问这个,所以很多人都在讨论这个存疑点
作者: KoeiSangokushi    时间: 2013-6-29 13:45

posted by wap, platform: Chrome
引用:
原帖由 @madrista7  于 2013-6-29 13:44 发表
DF原文确实没有说,但是如果没降频,不符合192GB的带宽数,DF也没去追问这个,所以很多人都在讨论这个存疑点
有可能GPU核心不降频,但是ESRAM降频——为了取得同时读取和写入而付出的代价
GPU核心频率和显存频率一直以来都是两个不同的概念,两者没有必要必须绑定在一个频率上

本帖最后由 KoeiSangokushi 于 2013-6-29 13:46 通过手机版编辑
作者: 倍舒爽    时间: 2013-6-29 13:48

posted by wap, platform: iPhone

符合,上面lkig解读得十分正确
作者: 你老闆    时间: 2013-6-29 13:49

引用:
原帖由 lkig 于 2013-6-29 08:22 发表


看的懂數據跟原理跟是不是開發者完全兩碼事~~~~
記憶體存取這方面的原理其實很久沒有大進展了基本上都是一直疊床架屋下去
跟GPU一代變革過一代相去甚遠矣~~~~

文章最後還有提到GDDR5的高延遲可能對PS4的CPU ...
其實我這句不是跟你講
作者: KoeiSangokushi    时间: 2013-6-29 13:51

posted by wap, platform: Chrome
引用:
原帖由 @倍舒爽  于 2013-6-29 13:48 发表
posted by wap, platform: iPhone

符合,上面lkig解读得十分正确
没发现有什么符合的,他说PS4可以用CPU缓冲来解决GDDR5不适合当系统内存的问题,我说PS4的CPU和X1一样,凭什么PS4就能解决?
作者: 倍舒爽    时间: 2013-6-29 13:58

posted by wap, platform: iPhone
引用:
原帖由 @KoeiSangokushi  于 2013-6-29 13:51 发表
posted by wap, platform: Chrome

没发现有什么符合的,他说PS4可以用CPU缓冲来解决GDDR5不适合当系统内存的问题,我说PS4的CPU和X1一样,凭什么PS4就能解决?
这是另外一回事
作者: KoeiSangokushi    时间: 2013-6-29 14:00

posted by wap, platform: Chrome
引用:
原帖由 @倍舒爽  于 2013-6-29 13:58 发表
posted by wap, platform: iPhone

这是另外一回事
那是另外一回事
作者: KoeiSangokushi    时间: 2013-6-29 14:11

posted by wap, platform: Chrome

Apparently it's confirmed by people who didn't think about this critically in the least (or who did but have a vested interest in a specific result). To wit:

192.0 / 102.4 = 1.875 (or 87.5% improvement, which was rounded up to 88% in the story).

87.5% is also easily expressed as 7/8. So the difference between 100% simultaneous read-write and what they've discussed is 1/8, which is also the fraction of bits to a byte.

So while of course MS could have downclocked by 50MHZ, without telling the developers, and then putting out that information to be quickly shot down, a much more reasonable and intelligent hypothesis would be that 1/8 of the ram (4MB) at a time is not bidirectional. Not being a hardware/graphics guy myself, just a programmer in an entirely separate field, I don't know why or how that would work - my best guess is that they'd have to reserve a 4MB chunk as a sub-cache that's either read or write at a given time, and the remaining 28 MB is open for simultaneous read/write.

But this math is just so obvious that it disappoints me that it appears nobody's actually come up with it.
作者: 倍舒爽    时间: 2013-6-29 14:11

posted by wap, platform: iPhone
引用:
原帖由 @KoeiSangokushi  于 2013-6-29 13:45 发表
posted by wap, platform: Chrome

有可能GPU核心不降频,但是ESRAM降频——为了取得同时读取和写入而付出的代价
GPU核心频率和显存频率一直以来都是两个不同的概念,两者没有必要必须绑定在一个频率上

本帖最后由 KoeiSangokushi 于 2013629 13:46 通过手机版编辑  
不是这个意思,你要确保这1秒内的所有周期都处于同时读写下才能达到192,但这在实际中是根本不可能的,假如这秒内处于完全写的情况下一样是102,但这不常见的,而在最常用的alpha blending下,就是133
作者: KoeiSangokushi    时间: 2013-6-29 14:13

posted by wap, platform: Chrome

192/102.4=1.875
也就是1又7/8
也就是可能当完全读取102.4GB/s带宽的时候,有4MB的ESRAM不能在此时被写入(28/32=7/8),所以此时写入带宽仅为89.6GB/s
完全符合,不需要降频
作者: KoeiSangokushi    时间: 2013-6-29 14:16

posted by wap, platform: Chrome
引用:
原帖由 @倍舒爽  于 2013-6-29 14:11 发表
posted by wap, platform: iPhone

不是这个意思,你要确保这1秒内的所有周期都处于同时读写下才能达到192,但这在实际中是根本不可能的,假如这秒内处于完全写的情况下一样是102,但这不常见的,而在最常用的alpha blending下,就是133
现在最常用的133,不代表以后不会出现166 188
作者: seek    时间: 2013-6-29 14:22

引用:
原帖由 KoeiSangokushi 于 2013-6-29 13:51 发表
posted by wap, platform: Chrome

没发现有什么符合的,他说PS4可以用CPU缓冲来解决GDDR5不适合当系统内存的问题,我说PS4的CPU和X1一样,凭什么PS4就能解决?
1. gddr5为什么不适合作系统内存?ddr3比gddr5还适合?
2. 或者说是esram可以被cpu利用?
作者: KoeiSangokushi    时间: 2013-6-29 14:27

posted by wap, platform: Chrome
引用:
原帖由 @seek  于 2013-6-29 14:22 发表
1. gddr5为什么不适合作系统内存?ddr3比gddr5还适合?
2. 或者说是esram可以被cpu利用?
1.GDDR5延迟太大,不适合做系统内存,你看现在的高端PC就算搭配了六核心高频率酷睿i7也还是用高频率DDR3做系统内存,下一代高端PC则是瞄准DDR4,绝不用GDDR5——下一代APU倒是可能会有GDDR5,但是都知道那纯粹是为了省一份显存的钱

2.GDDR5适合做显存,是因为GPU对延迟没有CPU那么敏感,我拿ESRAM出来是想说,要轮到说CPU用缓存来缓解GDDR5的延迟,那也是X1更有资格说这话,因为首先X1的CPU和PS4完全一致,两者的CPU缓存规格是一样的,其次X1的CPU理论上也可访问ESRAM,X1的系统整体上就是一个低延迟的体系

3.就算是做显存,ESRAM依然完胜GDDR5,前者的缺点仅是容量小,成本高,所以微软设计了数据转移系统,并且在DX11.2给予了直接的支持,去除编程上的困难

本帖最后由 KoeiSangokushi 于 2013-6-29 14:33 通过手机版编辑
作者: seek    时间: 2013-6-29 14:31

哎呀,计算机系统结构上还是ms专业..sony毕竟是做音响起家的门外汉..
作者: BlackGod    时间: 2013-6-29 14:46

喷了 还在这里扯gddr5的延迟不适合做内存……这挣扎的太难看了
作者: 倍舒爽    时间: 2013-6-29 14:46

posted by wap, platform: iPhone
引用:
原帖由 @KoeiSangokushi  于 2013-6-29 14:16 发表
posted by wap, platform: Chrome

现在最常用的133,不代表以后不会出现166 188
当然可能,但fp16已经是属下限格式了,降到fp10带宽当然会跟着上
作者: KoeiSangokushi    时间: 2013-6-29 14:51

posted by wap, platform: Chrome
引用:
原帖由 @BlackGod  于 2013-6-29 14:46 发表
喷了 还在这里扯gddr5的延迟不适合做内存……这挣扎的太难看了
六核高频率I7都依然用2133MHz的DDR3
只有APU下一代为了省份显存的钱硬上GDDR5,我敢说这玩意的CPU性能一定会很难看,受到高延迟的拖累太严重了
真当X1用DDR3当主内存是为了省钱?拜托,人家是上了一块ESRAM充当事实上的显存的

更何况英特尔拿出来跟APU竞争的整合核心显卡CPU新品也是搭载EDRAM的,DDR3/4+EDRAM/ESRAM的综合内存性能必然强于单纯傻大粗既当内存又当显存的GDDR5(注意,不是指高端PC的DDR3/4+GDDR5的组合)

本帖最后由 KoeiSangokushi 于 2013-6-29 15:00 通过手机版编辑
作者: BlackGod    时间: 2013-6-29 14:51

引用:
原帖由 KoeiSangokushi 于 2013-6-29 14:13 发表
posted by wap, platform: Chrome

192/102.4=1.875
也就是1又7/8
也就是可能当完全读取102.4GB/s带宽的时候,有4MB的ESRAM不能在此时被写入(28/32=7/8),所以此时写入带宽仅为89.6GB/s
完全符合,不需要降频
我觉得你还是相信降频的好 哪有这样设计的硬件?xbone sdk是不是还要特意注明一句 使用esram的时候 请判断写入的是28还是4
作者: KoeiSangokushi    时间: 2013-6-29 14:55

posted by wap, platform: Chrome
引用:
原帖由 @BlackGod  于 2013-6-29 14:51 发表
我觉得你还是相信降频的好 哪有这样设计的硬件?xbone sdk是不是还要特意注明一句 使用esram的时候 请判断写入的是28还是4
这个问题不用你担心,微软的开发环境是最令人的放心的东西
之前有人说协调DDR3和ESRAM的数据转移对编程是一个挑战,马上微软就推出DX11.2针对小缓存和主内存的优化设计了一整套的方案,搞定了这个问题
作者: 倍舒爽    时间: 2013-6-29 14:59

posted by wap, platform: iPhone
引用:
原帖由 @KoeiSangokushi  于 2013-6-29 14:51 发表
posted by wap, platform: Chrome

六核高频率I7都依然用2133MHz的DDR3
只有APU下一代为了省份显存的钱硬上GDDR5,我敢说这玩意的CPU性能一定会很难看,受到高延迟的拖累太严重了
真当X1用DDR3当主内存是为了省钱?拜托,人家是上了一块ESRAM充当事实上的显存的

更何况英特尔拿出来跟APU竞争的整合核心显卡的CPU新品也是搭载EDRAM的,DDR3/4+EDRAM/ESRAM的综合内存性能必然强于单纯一个傻大粗的既当内存又当显存的高频率GDDR5(注意,不是高端PC的DDR3+GDDR5的组合,DDR3+GDDR5的组合,内存性能三种方案中最强的)

本帖最后由 KoeiSangokushi 于 2013629 14:58 通过手机版编辑  
天!魔戒之吧主归来!
同时也失忆了
作者: KoeiSangokushi    时间: 2013-6-29 15:01

posted by wap, platform: Chrome
引用:
原帖由 @倍舒爽  于 2013-6-29 14:59 发表
posted by wap, platform: iPhone

天!魔戒之吧主归来!
同时也失忆了
之前的方向错了,GDDR5的高延迟不是对GPU不利,而是对CPU不利
作者: 小僵尸    时间: 2013-6-29 15:02

引用:
原帖由 KoeiSangokushi 于 2013-6-29 14:51 发表
posted by wap, platform: Chrome

六核高频率I7都依然用2133MHz的DDR3
只有APU下一代为了省份显存的钱硬上GDDR5,我敢说这玩意的CPU性能一定会很难看,受到高延迟的拖累太严重了
真当X1用DDR3当主内存是为了省钱? ...
麻烦你找2条8G的 GDDR5来看看,你准备用多大的空间来处理
I7配合DDR3是游戏和影音专用? 那是为了兼容和通用性好不好,整个机制都不一样.
APU系统上CPU的性能可以用贫弱来形容了,整个APU就是以GPU为主的系统
至于X1是不是为了省钱用了DDR3,这个你可以再次询问阿社君
作者: 美利坚游客    时间: 2013-6-29 15:03

引用:
原帖由 KoeiSangokushi 于 2013-6-29 14:27 发表
posted by wap, platform: Chrome

1.GDDR5延迟太大,不适合做系统内存,你看现在的高端PC就算搭配了六核心高频率酷睿i7也还是用高频率DDR3做系统内存,下一代高端PC则是瞄准DDR4,绝不用GDDR5——下一代APU倒是可能 ...
去把马克塞尼那篇文章好好读一遍再来吧




欢迎光临 TGFC Lifestyle (http://bbs.tgfcer.com/) Powered by Discuz! 6.0.0