原帖由 倍舒爽 于 2013-4-29 11:37 发表
posted by wap, platform: iPhone
ddr4甚至stacked dram要出的话还有一段长时间,其实lz以你的知识水准肯定明白为啥pc的apu要上edram,对不
原帖由 @KoeiSangokushi 于 2013-4-29 12:01 发表
我确实认为带EDRAM的APU会比不带EDRAM只依靠共享内存的的APU性能更好
原帖由 倍舒爽 于 2013-4-29 12:21 发表
posted by wap, platform: iPhone
这是一定的,但在pc上也是无奈的,不然就没有其他低成本的内存总线解决方案了,只能走pcb
原帖由 KoeiSangokushi 于 2013-4-29 12:23 发表
PS4的统一寻址和PC传统的集成显卡共享显存相比,只有一个好处,就是免得纹理内容在内存中再转存一次
但是缺点就是,内存溢出的风险可能会加大,对于达芬奇这种程序高手可能不是问题,但是对于一般开发商而言就未必 ...
原帖由 倍舒爽 于 2013-4-29 13:24 发表
“原因可能仅只是因为在APU内融入ESRAM的制造难度较高”
偶开始是这么想,现在不是了。。
1.达芬奇说是edram是成本更低廉的方案
(我假设sony是原罪的,假设这段是他的pr话,但是单一高速内存池带来更便利的开发 ...
原帖由 boboqpai 于 2013-4-29 13:38 发表
首先GPU这种数学浮点计算器对大缓存不敏感,但对内存带宽的提升却是立竿见影的。
其次很明显720的ESRAM更多的是照顾GPU,因为它对于CPU/GPU并不是对称的,CPU还需要通过北桥才能访问到ESRAM,能否进行统一编址还是 ...
原帖由 KoeiSangokushi 于 2013-4-29 13:49 发表
按1的逻辑独立显存都是废物
2是的前半句是废话,后半句跟3矛盾
3带来的难度增加不及统一寻址带来的内存泄漏风险带来的开发难度增加
原帖由 KoeiSangokushi 于 2013-4-29 13:29 发表
1、EDRAM是成本更低的方案,但是ESRAM同容量成本是EDRAM的十倍,效能也是远胜
2、蓝星最强芯片商在EDRAM上都表示有此顾虑,这很好的解释了之前XBOX无限在搭载ESRAM的APU量产问题上的反复,另外SRAM跟DRAM原理 ...
原帖由 boboqpai 于 2013-4-29 13:38 发表
首先GPU这种数学浮点计算器对大缓存不敏感,但对内存带宽的提升却是立竿见影的。
其次很明显720的ESRAM更多的是照顾GPU,因为它对于CPU/GPU并不是对称的,CPU还需要通过北桥才能访问到ESRAM,能否进行统一编址还是 ...
原帖由 boboqpai 于 2013-4-29 13:54 发表
第一条你理解不能,在DDR3这种低带宽内存基础上使用一颗高速内存可极大提高内存带宽。
第二没有冲突,不能统一编址编程难度肯定增加。
第三,这种低级错误豪不担心。
原帖由 倍舒爽 于 2013-4-29 13:56 发表
我认为当时ivb没上edram是因为和软件方面大环境有关。。
。。。。这里当然包括ms的dx制定步伐。。
haswell作为同样是以统一寻址,异构运算为目标的apu~无论解决方案多先进有效。。
如果api,应用软件环境跟 ...
原帖由 boboqpai 于 2013-4-29 14:04 发表
巨硬之所以这样设计ESRAM就证明其考虑初衷并不是异构计算,就算是DirectCompute,GPU执行的部分也是以数学形式进行,对大缓存不敏感。
原帖由 thinkerl 于 2013-4-29 14:08 发表
看了半天,我想你的观点是:
3盒 有类esram架构的大intel精神光环加成;
4p 是傻愣粗暴有效的8GB DDR5 176GB/s暴力带宽。
一个是四两拨千斤太极宗师;
一个是重量级格斗拳王。
是不是这个道理?:lo ...
原帖由 boboqpai 于 2013-4-29 14:04 发表
巨硬之所以这样设计ESRAM就证明其考虑初衷并不是异构计算,就算是DirectCompute,GPU执行的部分也是以数学形式进行,对大缓存不敏感。
原帖由 shinkamui 于 2013-4-29 14:15 发表
你一定没写过gpgpu程序,写过的就知道大缓存多重要。否则pixel shader就能做大部分事情了干嘛要出个compute shader
原帖由 KoeiSangokushi 于 2013-4-29 13:49 发表
按1的逻辑独立显存都是废物
2的前半句是废话,后半句跟3矛盾
3带来的难度增加不及统一寻址带来的内存泄漏风险带来的开发难度增加
原帖由 shinkamui 于 2013-4-29 14:45 发表
说了半天你还是没搞过,shader根本不存在什么前端后端的。看看书明白了再出来说话会死么?非要不懂装懂。
cerny的读写缓存开销分两点,一个是set device资源,一个是device计算时读写资源,就是更加说明了大缓存 ...
原帖由 FXCarl 于 2013-4-29 21:33 发表
我是不觉得内存泄漏和统一架构有什么关系,顺带我也并不认为大多数的程序员需要关心这个方面 …… 老老实实的申请空间销毁对象,泄漏个毛线啊。我倒认为内存越多越毛病,数据挪来挪去的。
编程复杂度的问题更像是 ...
原帖由 boboqpai 于 2013-4-30 08:34 发表
来分析下,如果这颗edram对异构计算作用这么大,为什么intel不把它用在桌面?intel也只提到gpu性能。
前面说的720那颗esram不再同一总线同一控制器下,如果不能统一编址(共享数据),那意味着数据需复制到内存才能 ...
原帖由 FXCarl 于 2013-4-30 13:07 发表
…… 总觉得异构计算的需求属于很微妙的领域。目前绝大多数抱怨速度不够快的应用场合对速度的容忍都很宽裕。譬如 Final Cut Pro 这种东西,出个片子总归几个小时,能提升数倍显然不错,但是此时又对数据拷贝多消 ...
原帖由 @qyqgpower 于 2013-4-30 20:14 发表
已经有消息称这块EDRAM是CPU逻辑部分和GPU部分共用的了。
IBM的主机用的POWER7就有超大内嵌缓存,Intel说不定也会在Xeon上加这个
原帖由 FXCarl 于 2013-4-30 13:07 发表
…… 总觉得异构计算的需求属于很微妙的领域。目前绝大多数抱怨速度不够快的应用场合对速度的容忍都很宽裕。譬如 Final Cut Pro 这种东西,出个片子总归几个小时,能提升数倍显然不错,但是此时又对数据拷贝多消 ...
原帖由 @FXCarl 于 2013-4-30 23:35 发表
我看到了 …… 驱动之家有,GT3e 只有 移动版 i7 独享 …… 桌面全部是 GT2 ~![]()
原帖由 @倍舒爽 于 2013-5-1 02:43 发表
posted by wap, platform: iPhone
其实如果给非编带来巨大效率转变的话还是很实际的。
比如婚礼跟拍时,几个人一般都带着器材跑整天,我一直觉得如果能在当天酒席开始时就能在酒楼的大屏上播放一个当天的demo,那肯 ...
原帖由 @fgfggha 于 2013-5-2 18:09 发表
posted by wap, platform: Android
surface 第二代秒杀WIIU的节奏
原帖由 KoeiSangokushi 于 2013-5-2 18:36 发表
posted by wap, platform: Chrome
秒不了,顶多秒PSV
WII U等第一方游戏出来后还是大有可为的
原帖由 @KoeiSangokushi 于 2013-5-1 05:06 发表
posted by wap, platform: iPhone
别忘了这回次世代家用机用的都是上网本U
原帖由 @倍舒爽 于 2013-5-3 04:00 发表
posted by wap, platform: iPhone
详细些ok?言下之意?
欢迎光临 TGFC Lifestyle (http://bbs.tgfcer.com/) | Powered by Discuz! 6.0.0 |