» 您尚未登录:请 登录 | 注册 | 标签 | 帮助 | 小黑屋 |


 16 12
发新话题
打印

[新闻] 【英特尔版四两拨千斤】Haswell中的eDRAM:性能提升明显 价格稍贵

有关Haswell的核芯显卡,在最近可谓异常吸引眼球。
  在北京IDF2013上,施浩德曾表示:“Haswell中的核芯显卡的性能,将能够超过80%中国市场中的独立显卡。”
  这一惊人的数字令现场很多人惊讶不已。就连笔者也没有想到,Haswell中的核芯显卡会有这么强大。当然,性能到底如何,我们还不能断言,还是要看实际的测试结果。
而最近,有关Haswell核芯显卡又有了一些消息。Haswell处理器的核芯显卡不但有GT1、GT2、GT3三个档次,最上边还有个整合eDRAM缓存的GT3e
  而有关eDRAM缓存,笔者在之前的一篇文章中,做过详细的介绍和分析。而最近,通过更细致、专业的分析,我们又发现了这点缓存的更多秘密。
  话说DRAM这个缓存,其实早在Ivy Bridge中,Intel就曾经考虑过将其整合到芯片中,以此来提高GPU的性能。但是后来,出于对成本和发热量两方面考虑,这种设计被欧德宁否定了。随之,这个计划也就流产了。
  而在即将发布的Haswell里,我们终于能够见到DRAM了。Haswell中的GPU搭配40个执行单元,这将是Intel有史以来最强大的图形核心,并且号称能够媲美NVIDIA GeForce GT 650M。不过这也只是会出现在高端笔记本当中,貌似在桌面平台和超极本中我们无缘见面。
  Intel曾经发布过一篇论文“具备三栅极晶体管和MIMCAP集成缓存的22nm高性能嵌入式DRAM SoC技术”。据此分析,Haswell GT3e搭配了128MB eDRAM缓存,和处理器之间的通信总线位宽在达到了512-bit,带宽估计有64GB/s,达到了主流笔记本显卡的水平。
  之所以用eDRAM而不用DDR3,主要是因为eDRAM更容易集成到Intel现有的工艺中,还有功耗、制造难度、成本等方面的考虑。
  Intel 22nm工艺下,eDRAM每个单元的面积是0.029平方微米,存储密度大约是每平方毫米17.5Mb,128MB就接近60平方毫米,还得加上外部接口等模块,估计总面积70-80平方毫米,即使这样,也将占据Haswell 1/3左右的面积,Haswell处理器本身约210-240平方毫米。
  而本文想说的重点,则是有关搭载GT3e处理器的价格。
  如果你想购买具备GT3e的处理器,需要为这些缓存额外支付多达50美元,价格相当高,已经可以入手一款低端的双核处理器了。所以它注定了只会用在高端笔记本上。要知道,Core i7-4770K的代理商报价为327美元,如果配备GT3e的话就会升至377美元,估计很多人都无法接受。


TOP

引用:
原帖由 倍舒爽 于 2013-4-29 11:37 发表
posted by wap, platform: iPhone

ddr4甚至stacked dram要出的话还有一段长时间,其实lz以你的知识水准肯定明白为啥pc的apu要上edram,对不
我确实认为带EDRAM的APU会比不带EDRAM只依靠共享内存的的APU性能更好

[ 本帖最后由 KoeiSangokushi 于 2013-4-29 12:44 编辑 ]



TOP

引用:
原帖由 宜静和大雄 于 2013-4-29 11:41 发表
笔记本 从来都不用 带独显的。。 这个CPU 我会考虑。

不过媲美2G显存。这个 靠谱么。
EDRAM只要很小的容量就能实现大容量高带宽普通DDR内存的性能
当然,ESRAM比EDRAM还强的多


TOP

引用:
原帖由 倍舒爽 于 2013-4-29 12:21 发表
posted by wap, platform: iPhone

这是一定的,但在pc上也是无奈的,不然就没有其他低成本的内存总线解决方案了,只能走pcb
PS4的统一寻址和PC传统的集成显卡共享显存相比,只有一个好处,就是免得纹理内容在内存中再转存一次
但是缺点就是,内存溢出的风险可能会加大,对于达芬奇这种程序高手可能不是问题,但是对于一般开发商而言就未必
或许这就正是PS4仅能利用5GB内存的原因——除去系统开销,还要为防范内存溢出而在内存上划分出额外的缓冲区

相对而言,不存在纹理内容在内存中再转存一次问题的XBOX360和XBOX无限的策略要更聪明
直接将纹理内容载入主内存,然后把需要实时使用的内容在DME的协助下通过高速低延迟EDRAM/ESRAM进行转移
更为干脆利落,不留空档

我更为倾向于认为PS4的这种做法不是达芬奇所谓的“为开发降低难度”,恰恰相反,这种做法比XBOX360和XBOX无限的取巧机制要更麻烦,对开发商要求更高。原因可能仅只是因为在APU内融入ESRAM的制造难度较高,索尼缺乏这类芯片级设计人才,不愿意冒良率较低和延迟发售的风险。

[ 本帖最后由 KoeiSangokushi 于 2013-4-29 14:20 编辑 ]

TOP

引用:
原帖由 KoeiSangokushi 于 2013-4-29 12:23 发表

PS4的统一寻址和PC传统的集成显卡共享显存相比,只有一个好处,就是免得纹理内容在内存中再转存一次
但是缺点就是,内存溢出的风险可能会加大,对于达芬奇这种程序高手可能不是问题,但是对于一般开发商而言就未必 ...
这还仅是在传统渲染方式中EDRAM和ESRAM所拥有的优势
若把眼光放到未来的通用计算之中的话,可以充当APU的L3的ESRAM则更容易发挥其独特的威力

[ 本帖最后由 KoeiSangokushi 于 2013-4-29 12:50 编辑 ]

TOP

引用:
原帖由 倍舒爽 于 2013-4-29 13:24 发表
“原因可能仅只是因为在APU内融入ESRAM的制造难度较高”
偶开始是这么想,现在不是了。。

1.达芬奇说是edram是成本更低廉的方案
(我假设sony是原罪的,假设这段是他的pr话,但是单一高速内存池带来更便利的开发 ...
1、EDRAM是成本更低的方案,但是ESRAM同容量成本是EDRAM的十倍,效能也是远胜

2、蓝星最强芯片商在EDRAM上都表示有此顾虑,这很好的解释了之前XBOX无限在搭载ESRAM的APU量产问题上的反复,另外SRAM跟DRAM原理不一样,DRAM有的问题SRAM不一定有,反过来SRAM可能会多一些技术挑战

3、参考1、

4、索尼在内存芯片上不弱,但是在SOC上没见有太大长处,跟INTEL-MS-AMD-IBM团体的紧密关系不同。而在APU内集成ESRAM不应该被认为是一件容易的事

[ 本帖最后由 KoeiSangokushi 于 2013-4-29 13:39 编辑 ]

TOP

引用:
原帖由 boboqpai 于 2013-4-29 13:38 发表
首先GPU这种数学浮点计算器对大缓存不敏感,但对内存带宽的提升却是立竿见影的。

其次很明显720的ESRAM更多的是照顾GPU,因为它对于CPU/GPU并不是对称的,CPU还需要通过北桥才能访问到ESRAM,能否进行统一编址还是 ...
按1的逻辑独立显存都是废物
2的前半句是废话,后半句跟3矛盾
3带来的难度增加不及统一寻址带来的内存泄漏风险带来的开发难度增加

[ 本帖最后由 KoeiSangokushi 于 2013-4-29 13:53 编辑 ]

TOP

引用:
原帖由 thinkerl 于 2011-6-12 02:40 发表

其实,我只是恨铁不成钢的 索饭。 ...
:D :D :D :D

TOP

引用:
原帖由 boboqpai 于 2013-4-29 13:54 发表


第一条你理解不能,在DDR3这种低带宽内存基础上使用一颗高速内存可极大提高内存带宽。

第二没有冲突,不能统一编址编程难度肯定增加。

第三,这种低级错误豪不担心。
1、ESRAM本身就是延迟不足GDDR5十分之一,带宽达到100GB/S以上的高速内存

2的后半句和3当然有冲突,DME就是让数据移动难度大幅下降的工具

3、这种低级错误的结果就是只给游戏用5GB的RAM,剩下3GB除了作为系统和社交程序所用,恐怕还包括了在内存中划分的缓冲区域

[ 本帖最后由 KoeiSangokushi 于 2013-4-29 14:03 编辑 ]

TOP

引用:
原帖由 倍舒爽 于 2013-4-29 13:56 发表


我认为当时ivb没上edram是因为和软件方面大环境有关。。
。。。。这里当然包括ms的dx制定步伐。。

haswell作为同样是以统一寻址,异构运算为目标的apu~无论解决方案多先进有效。。
如果api,应用软件环境跟 ...
基本赞同

TOP

引用:
原帖由 boboqpai 于 2013-4-29 14:04 发表


巨硬之所以这样设计ESRAM就证明其考虑初衷并不是异构计算,就算是DirectCompute,GPU执行的部分也是以数学形式进行,对大缓存不敏感。
XBOX无限APU内置的ESRAM仅32MB,容量很大么?

TOP

引用:
原帖由 thinkerl 于 2013-4-29 14:08 发表



看了半天,我想你的观点是:
3盒 有类esram架构的大intel精神光环加成;
4p 是傻愣粗暴有效的8GB DDR5 176GB/s暴力带宽。

一个是四两拨千斤太极宗师;
一个是重量级格斗拳王。


是不是这个道理?:lo ...
:D :D :D :D

TOP

引用:
原帖由 首斩破沙罗 于 2013-4-29 14:25 发表

谁告诉你难度增加了? 那个技术文档说一定会有内存泄漏风险而720就没有了?
我跟一位业余引擎爱好者交流制作MOD的心得时,随口提到XBOX360内存比PS3更灵活
他的回答是:XBOX360这样做的弊端就是,如果不搭载EDRAM而一味操作512MB的主内存的话,容易造成内存泄漏,而PS3的分离式内存则不存在这一问题。

如果不搭载EDRAM的话,也不是没有方法解决内存泄漏的问题,那就是在512MB主内存中划出相当一部分的容量作为缓冲区,但在这样做的后果就是可用内存减少。

[ 本帖最后由 KoeiSangokushi 于 2013-4-29 14:39 编辑 ]

TOP

posted by wap, platform: iPhone
引用:
原帖由 @倍舒爽  于 2013-5-1 02:43 发表
posted by wap, platform: iPhone

其实如果给非编带来巨大效率转变的话还是很实际的。
比如婚礼跟拍时,几个人一般都带着器材跑整天,我一直觉得如果能在当天酒席开始时就能在酒楼的大屏上播放一个当天的demo,那肯 ...
别忘了这回次世代家用机用的都是上网本U

TOP

posted by wap, platform: Chrome
引用:
原帖由 @fgfggha  于 2013-5-2 18:09 发表
posted by wap, platform: Android

surface 第二代秒杀WIIU的节奏
秒不了,顶多秒PSV
WII U等第一方游戏出来后还是大有可为的

TOP

 16 12
发新话题
     
官方公众号及微博