打印

[新闻] 【英特尔版四两拨千斤】Haswell中的eDRAM：性能提升明显价格稍贵

boboqpai

小黑屋

帖子: 736
精华: 0
积分: 9328
激骚: 200 度
爱车
主机
相机
手机
注册时间: 2004-11-8

发短消息
加为好友
当前离线

1^# 大中小发表于 2013-4-29 13:38 显示全部帖子

首先GPU这种数学浮点计算器对大缓存不敏感，但对内存带宽的提升却是立竿见影的。

其次很明显720的ESRAM更多的是照顾GPU，因为它对于CPU/GPU并不是对称的，CPU还需要通过北桥才能访问到ESRAM，能否进行统一编址还是个大疑问。

最后，由于720的ESRAM和DME，PS4编程比720简单这是肯定的。

[ 本帖最后由 boboqpai 于 2013-4-29 13:40 编辑 ]

TOP

boboqpai

小黑屋

帖子: 736
精华: 0
积分: 9328
激骚: 200 度
爱车
主机
相机
手机
注册时间: 2004-11-8

发短消息
加为好友
当前离线

2^# 大中小发表于 2013-4-29 13:54 显示全部帖子

引用:

原帖由 KoeiSangokushi 于 2013-4-29 13:49 发表

按1的逻辑独立显存都是废物
2是的前半句是废话，后半句跟3矛盾
3带来的难度增加不及统一寻址带来的内存泄漏风险带来的开发难度增加

第一条你理解不能，在DDR3这种低带宽内存基础上使用一颗高速内存可极大提高内存带宽。

第二没有冲突，不能统一编址编程难度肯定增加。

第三，这种低级错误豪不担心。

TOP

boboqpai

小黑屋

帖子: 736
精华: 0
积分: 9328
激骚: 200 度
爱车
主机
相机
手机
注册时间: 2004-11-8

发短消息
加为好友
当前离线

3^# 大中小发表于 2013-4-29 14:04 显示全部帖子

引用:

原帖由 shinkamui 于 2013-4-29 13:59 发表

通用计算极端需要大缓存

巨硬之所以这样设计ESRAM就证明其考虑初衷并不是异构计算，就算是DirectCompute，GPU执行的部分也是以数学形式进行，对大缓存不敏感。

TOP

boboqpai

小黑屋

帖子: 736
精华: 0
积分: 9328
激骚: 200 度
爱车
主机
相机
手机
注册时间: 2004-11-8

发短消息
加为好友
当前离线

4^# 大中小发表于 2013-4-29 14:21 显示全部帖子

引用:

原帖由 shinkamui 于 2013-4-29 14:15 发表

你一定没写过gpgpu程序，写过的就知道大缓存多重要。否则pixel shader就能做大部分事情了干嘛要出个compute shader

Compute Shader前半部缓存在CPU里

TOP

boboqpai

小黑屋

帖子: 736
精华: 0
积分: 9328
激骚: 200 度
爱车
主机
相机
手机
注册时间: 2004-11-8

发短消息
加为好友
当前离线

5^# 大中小发表于 2013-4-29 14:39 显示全部帖子

引用:

原帖由 shinkamui 于 2013-4-29 14:26 发表

真心不知道你在说什么。没写过的话，至少去看看例子。最简单的比如nbody，blur之类，看看性能是怎么提升的。

直接说关键了，读写缓存方面的开销，Cerny提到了这个。

TOP

boboqpai

小黑屋

帖子: 736
精华: 0
积分: 9328
激骚: 200 度
爱车
主机
相机
手机
注册时间: 2004-11-8

发短消息
加为好友
当前离线

6^# 大中小发表于 2013-4-29 14:51 显示全部帖子

引用:

原帖由 shinkamui 于 2013-4-29 14:45 发表

说了半天你还是没搞过，shader根本不存在什么前端后端的。看看书明白了再出来说话会死么？非要不懂装懂。

cerny的读写缓存开销分两点，一个是set device资源，一个是device计算时读写资源，就是更加说明了大缓存 ...

Cerny的意思不是直接在内存set device？绕过缓存。

TOP

boboqpai

小黑屋

帖子: 736
精华: 0
积分: 9328
激骚: 200 度
爱车
主机
相机
手机
注册时间: 2004-11-8

发短消息
加为好友
当前离线

7^# 大中小发表于 2013-4-29 15:30 显示全部帖子

还是看实际效果吧，720的esram并不是本地缓存，ps4的做法也是第一次，都不知道效果怎样。

TOP

boboqpai

小黑屋

帖子: 736
精华: 0
积分: 9328
激骚: 200 度
爱车
主机
相机
手机
注册时间: 2004-11-8

发短消息
加为好友
当前离线

8^# 大中小发表于 2013-4-30 08:34 显示全部帖子

来分析下，如果这颗edram对异构计算作用这么大，为什么intel不把它用在桌面？intel也只提到gpu性能。
前面说的720那颗esram不再同一总线同一控制器下，如果不能统一编址（共享数据），那意味着数据需复制到内存才能共享。

TOP

boboqpai

小黑屋

帖子: 736
精华: 0
积分: 9328
激骚: 200 度
爱车
主机
相机
手机
注册时间: 2004-11-8

发短消息
加为好友
当前离线

9^# 大中小发表于 2013-4-30 21:22 显示全部帖子

引用:

原帖由 倍舒爽 于 2013-4-30 20:45 发表
posted by wap, platform: iPhone

是啊，这么大的代价，按道理不可能光为gpu服务的。

他是指intel的haswell，720等进一步消息吧。

TOP

boboqpai

小黑屋

帖子: 736
精华: 0
积分: 9328
激骚: 200 度
爱车
主机
相机
手机
注册时间: 2004-11-8

发短消息
加为好友
当前离线

10^# 大中小发表于 2013-4-30 21:26 显示全部帖子

引用:

原帖由 FXCarl 于 2013-4-30 13:07 发表

…… 总觉得异构计算的需求属于很微妙的领域。目前绝大多数抱怨速度不够快的应用场合对速度的容忍都很宽裕。譬如 Final Cut Pro 这种东西，出个片子总归几个小时，能提升数倍显然不错，但是此时又对数据拷贝多消 ...

这也矛盾，edram只会用在笔记本，而且只有搭载intel最强核显的cpu才会有edram，其他的没有。

TOP

boboqpai

小黑屋

帖子: 736
精华: 0
积分: 9328
激骚: 200 度
爱车
主机
相机
手机
注册时间: 2004-11-8

发短消息
加为好友
当前离线

11^# 大中小发表于 2013-4-30 21:43 显示全部帖子

引用:

原帖由 倍舒爽 于 2013-4-30 21:36 发表

什么？？
求来源，只是笔记本用edram而已？？？
那之前确白yy！！

这个搜就可以了，到处是。

TOP

[新闻] 【英特尔版四两拨千斤】Haswell中的eDRAM：性能提升明显 价格稍贵

引用:

引用:

引用:

引用:

引用:

引用:

引用:

引用:

[新闻] 【英特尔版四两拨千斤】Haswell中的eDRAM：性能提升明显价格稍贵