» 您尚未登录:请 登录 | 注册 | 标签 | 帮助 | 小黑屋 |


 65 12345
发新话题
打印

[新闻] 【英特尔版四两拨千斤】Haswell中的eDRAM:性能提升明显 价格稍贵

有关Haswell的核芯显卡,在最近可谓异常吸引眼球。
  在北京IDF2013上,施浩德曾表示:“Haswell中的核芯显卡的性能,将能够超过80%中国市场中的独立显卡。”
  这一惊人的数字令现场很多人惊讶不已。就连笔者也没有想到,Haswell中的核芯显卡会有这么强大。当然,性能到底如何,我们还不能断言,还是要看实际的测试结果。
而最近,有关Haswell核芯显卡又有了一些消息。Haswell处理器的核芯显卡不但有GT1、GT2、GT3三个档次,最上边还有个整合eDRAM缓存的GT3e
  而有关eDRAM缓存,笔者在之前的一篇文章中,做过详细的介绍和分析。而最近,通过更细致、专业的分析,我们又发现了这点缓存的更多秘密。
  话说DRAM这个缓存,其实早在Ivy Bridge中,Intel就曾经考虑过将其整合到芯片中,以此来提高GPU的性能。但是后来,出于对成本和发热量两方面考虑,这种设计被欧德宁否定了。随之,这个计划也就流产了。
  而在即将发布的Haswell里,我们终于能够见到DRAM了。Haswell中的GPU搭配40个执行单元,这将是Intel有史以来最强大的图形核心,并且号称能够媲美NVIDIA GeForce GT 650M。不过这也只是会出现在高端笔记本当中,貌似在桌面平台和超极本中我们无缘见面。
  Intel曾经发布过一篇论文“具备三栅极晶体管和MIMCAP集成缓存的22nm高性能嵌入式DRAM SoC技术”。据此分析,Haswell GT3e搭配了128MB eDRAM缓存,和处理器之间的通信总线位宽在达到了512-bit,带宽估计有64GB/s,达到了主流笔记本显卡的水平。
  之所以用eDRAM而不用DDR3,主要是因为eDRAM更容易集成到Intel现有的工艺中,还有功耗、制造难度、成本等方面的考虑。
  Intel 22nm工艺下,eDRAM每个单元的面积是0.029平方微米,存储密度大约是每平方毫米17.5Mb,128MB就接近60平方毫米,还得加上外部接口等模块,估计总面积70-80平方毫米,即使这样,也将占据Haswell 1/3左右的面积,Haswell处理器本身约210-240平方毫米。
  而本文想说的重点,则是有关搭载GT3e处理器的价格。
  如果你想购买具备GT3e的处理器,需要为这些缓存额外支付多达50美元,价格相当高,已经可以入手一款低端的双核处理器了。所以它注定了只会用在高端笔记本上。要知道,Core i7-4770K的代理商报价为327美元,如果配备GT3e的话就会升至377美元,估计很多人都无法接受。


TOP

发热量低的话还好,不然就呵呵后



TOP

posted by wap, platform: iPhone

再明显不过了。

intel:
"  之所以用eDRAM而不用DDR3,主要是因为eDRAM更容易集成到Intel现有的工艺中,还有功耗、制造难度、成本等方面的考虑。"

SONY:
"Cerny表示,原本团队也可以将总线位宽缩水至128位,这样带宽就只有88GB/S,然后在芯片上集成eDRAM将性能提回去。一开始团队也考虑过这种更容易生产的做法。但由于这会增加开发者的复杂性,他们放弃了这种思路。不想为开发者社区造成麻烦,这就是坚持统一内存的原因。"


TOP

posted by wap, platform: iPhone

ddr4甚至stacked dram要出的话还有一段长时间,其实lz以你的知识水准肯定明白为啥pc的apu要上edram,对不

TOP

笔记本 从来都不用 带独显的。。 这个CPU 我会考虑。

不过媲美2G显存。这个 靠谱么。

TOP

引用:
原帖由 倍舒爽 于 2013-4-29 11:37 发表
posted by wap, platform: iPhone

ddr4甚至stacked dram要出的话还有一段长时间,其实lz以你的知识水准肯定明白为啥pc的apu要上edram,对不
我确实认为带EDRAM的APU会比不带EDRAM只依靠共享内存的的APU性能更好

[ 本帖最后由 KoeiSangokushi 于 2013-4-29 12:44 编辑 ]

TOP

引用:
原帖由 宜静和大雄 于 2013-4-29 11:41 发表
笔记本 从来都不用 带独显的。。 这个CPU 我会考虑。

不过媲美2G显存。这个 靠谱么。
EDRAM只要很小的容量就能实现大容量高带宽普通DDR内存的性能
当然,ESRAM比EDRAM还强的多

TOP

posted by wap, platform: iPhone
引用:
原帖由 @KoeiSangokushi  于 2013-4-29 12:01 发表
我确实认为带EDRAM的APU会比不带EDRAM只依靠共享内存的的APU性能更好
这是一定的,但在pc上也是无奈的,不然就没有其他低成本的内存总线解决方案了,只能走pcb

TOP

引用:
原帖由 倍舒爽 于 2013-4-29 12:21 发表
posted by wap, platform: iPhone

这是一定的,但在pc上也是无奈的,不然就没有其他低成本的内存总线解决方案了,只能走pcb
PS4的统一寻址和PC传统的集成显卡共享显存相比,只有一个好处,就是免得纹理内容在内存中再转存一次
但是缺点就是,内存溢出的风险可能会加大,对于达芬奇这种程序高手可能不是问题,但是对于一般开发商而言就未必
或许这就正是PS4仅能利用5GB内存的原因——除去系统开销,还要为防范内存溢出而在内存上划分出额外的缓冲区

相对而言,不存在纹理内容在内存中再转存一次问题的XBOX360和XBOX无限的策略要更聪明
直接将纹理内容载入主内存,然后把需要实时使用的内容在DME的协助下通过高速低延迟EDRAM/ESRAM进行转移
更为干脆利落,不留空档

我更为倾向于认为PS4的这种做法不是达芬奇所谓的“为开发降低难度”,恰恰相反,这种做法比XBOX360和XBOX无限的取巧机制要更麻烦,对开发商要求更高。原因可能仅只是因为在APU内融入ESRAM的制造难度较高,索尼缺乏这类芯片级设计人才,不愿意冒良率较低和延迟发售的风险。

[ 本帖最后由 KoeiSangokushi 于 2013-4-29 14:20 编辑 ]

TOP

引用:
原帖由 KoeiSangokushi 于 2013-4-29 12:23 发表

PS4的统一寻址和PC传统的集成显卡共享显存相比,只有一个好处,就是免得纹理内容在内存中再转存一次
但是缺点就是,内存溢出的风险可能会加大,对于达芬奇这种程序高手可能不是问题,但是对于一般开发商而言就未必 ...
这还仅是在传统渲染方式中EDRAM和ESRAM所拥有的优势
若把眼光放到未来的通用计算之中的话,可以充当APU的L3的ESRAM则更容易发挥其独特的威力

[ 本帖最后由 KoeiSangokushi 于 2013-4-29 12:50 编辑 ]

TOP

“原因可能仅只是因为在APU内融入ESRAM的制造难度较高”
偶开始是这么想,现在不是了。。

1.达芬奇说是edram是成本更低廉的方案
(我假设sony是原罪的,假设这段是他的pr话,但是单一高速内存池带来更便利的开发和内存利用效率在digital foundry的分析文中有肯定)

2.intel:还有功耗、制造难度、成本等方面的考虑。
(否则以pc的架构和现有的内存厂商生产的颗粒实在无解,频率不是最大重点,位宽才是硬伤!
解决带宽问题只能上stacked dram,根据nvidIA的roadmap,要到2015)

3.相信sony的团队不会比任天堂差,但是出了名抠的wiiu的gpu也是edram
(有别于intel和xenos的胶水daughter die,和durango一样是做到里面去的)

综合这三点去考量一下结果??

且芯片工程方面,sony也不算太差。某些方面有见长~
stacked cmos就是索尼首创并量产的,思路和stacked dram一样。。
另外其cmos份额也占据了世界6成市场,剩余的份额,不少也是一些低端应用的诉求~
还有被一度认为不可能的逆天工程:rx1掌上全幅机。。
可以了解下在这么狭窄的空间里要装上全幅cmos及相应高速dsp的难度到底有多大。。。



通用运算方面,我认同esram应该有比单纯的内存池有见长的地方。。
传统渲染,绝不可能,完全不需要看前端运算模块,光看后端输出就行,32rops vs 16rops

具体例子看ps3和xo就成,p3运算能力是强,像素化能力不及xo,始终碰了不少壁。。

[ 本帖最后由 倍舒爽 于 2013-4-29 13:32 编辑 ]

TOP

引用:
原帖由 倍舒爽 于 2013-4-29 13:24 发表
“原因可能仅只是因为在APU内融入ESRAM的制造难度较高”
偶开始是这么想,现在不是了。。

1.达芬奇说是edram是成本更低廉的方案
(我假设sony是原罪的,假设这段是他的pr话,但是单一高速内存池带来更便利的开发 ...
1、EDRAM是成本更低的方案,但是ESRAM同容量成本是EDRAM的十倍,效能也是远胜

2、蓝星最强芯片商在EDRAM上都表示有此顾虑,这很好的解释了之前XBOX无限在搭载ESRAM的APU量产问题上的反复,另外SRAM跟DRAM原理不一样,DRAM有的问题SRAM不一定有,反过来SRAM可能会多一些技术挑战

3、参考1、

4、索尼在内存芯片上不弱,但是在SOC上没见有太大长处,跟INTEL-MS-AMD-IBM团体的紧密关系不同。而在APU内集成ESRAM不应该被认为是一件容易的事

[ 本帖最后由 KoeiSangokushi 于 2013-4-29 13:39 编辑 ]

TOP

首先GPU这种数学浮点计算器对大缓存不敏感,但对内存带宽的提升却是立竿见影的。

其次很明显720的ESRAM更多的是照顾GPU,因为它对于CPU/GPU并不是对称的,CPU还需要通过北桥才能访问到ESRAM,能否进行统一编址还是个大疑问。

最后,由于720的ESRAM和DME,PS4编程比720简单这是肯定的。

[ 本帖最后由 boboqpai 于 2013-4-29 13:40 编辑 ]

TOP

说实话,我觉得“四两拨千斤”朋友应该是位中小学生;

出于兴趣,在网上搜罗一些专业名词,开口闭口砖家范儿,实际上狗屁不通。

我想说intel用esram关xbox妹事?

TOP

引用:
原帖由 boboqpai 于 2013-4-29 13:38 发表
首先GPU这种数学浮点计算器对大缓存不敏感,但对内存带宽的提升却是立竿见影的。

其次很明显720的ESRAM更多的是照顾GPU,因为它对于CPU/GPU并不是对称的,CPU还需要通过北桥才能访问到ESRAM,能否进行统一编址还是 ...
按1的逻辑独立显存都是废物
2的前半句是废话,后半句跟3矛盾
3带来的难度增加不及统一寻址带来的内存泄漏风险带来的开发难度增加

[ 本帖最后由 KoeiSangokushi 于 2013-4-29 13:53 编辑 ]

TOP

 65 12345
发新话题
     
官方公众号及微博