» 您尚未登录:请 登录 | 注册 | 标签 | 帮助 | 小黑屋 |


发新话题
打印

[新闻] AMD高级副总裁兼首席财务官透露下一代主机研发中,本代主机的生命周期可能会短一些

引用:
原帖由 KoeiSangokushi 于 2014-6-7 17:00 发表

再秒也不可能达到2006年HD2900纸面性能只有G80一半,高分辨率抗锯齿情况下只有四成,1年半之后的2008年初AMD拿出HD3870X2改进后的双GPU卡来还是只能在理论上达到G80单GPU同水平实际表现还是不如的差距

AMD最近6 ...
我不认为你这种推论对未来有什么借鉴价值,更无法否定差距拉大的可能性


TOP

引用:
原帖由 KoeiSangokushi 于 2014-6-7 17:10 发表

不,我这里说的吞吐不是指浮点吞吐,而是指带宽吞吐

浮点这个概念从进入上个次世代起就在游戏中没有实际意义了,因为有太多DirectComputer相关的东西了,拿来算蛋白质挖矿倒是有用
我是说前面提的纸面性能一半的说法,上面那链接里也有纹理、像素填充率的理论值。



TOP

引用:
原帖由 f0f0f0 于 2014-6-7 17:12 发表

我是说前面提的纸面性能一半的说法,上面那链接里也有纹理、像素填充率的理论值。
我已经解释了,就是GPU架构的规模

你说的纹理单元、像素填充率这些我没去看,因为瓶颈卡在了流处理器的渲染性能不足和ATI在当时不合理的光栅化单元设计所导致的低下抗锯齿性能上面

[ 本帖最后由 KoeiSangokushi 于 2014-6-7 17:15 编辑 ]


TOP

引用:
原帖由 f0f0f0 于 2014-6-7 17:02 发表
纸面性能是指理论性能还是?
R600弱到这个地步的主要原因是ROP有重大BUG,开了抗锯齿直接变成残废,连更老的显卡都没出现过这么离谱的问题
所以R700时代AMD重新设计了ROP,消除了BUG,为抗锯齿竭力优化
R600的纹理单元少了一些,在实际上依然是贴图吃重的时代非常吃亏

另外就是R600的规模不足,无法通过规模掩盖流水线的延迟问题,所以后来AMD一直到Cayman的发展方向都是围绕如何铺大饼而转圈
其实R600规模不足倒不是根本性问题,320个流处理器虽然打不过9600GT,但和9600GSO掰腕子还是没问题的
关键问题在于芯片面积大,发热量大,成本高,和相对低下的性能根本不成正比
后来AMD针对这个规模芯片的措施就是疯狂减肥,芯片面积小了,打得起价格战,性价比和收益都上来了
R700时代AMD的策略就是320个主打低端,640个主打终端,800个主打高端
不过不管怎么折腾,320个流处理器对付高端的G80绝对没戏,要800个才能相抗衡,所以R600输了,而且输的非常彻底

[ 本帖最后由 Nemo_theCaptain 于 2014-6-7 17:20 编辑 ]

TOP

另外我一直觉得假设05年nv能拿出g80架构产品是一件很搞笑的事情,这事情天知地知,你肯定不知
其实要这么比的话,12年初的680论能耗比依然可以轻松超过现在的290系列,而amd要有新产品也要等15年了,也就是说,amd至少落后3年,这好像比当时还要吓人,当时1900系列还是可以好过7800系列的

TOP

引用:
原帖由 KoeiSangokushi 于 2014-6-7 17:13 发表

我已经解释了,就是GPU架构的规模
这样比没意义,同厂家的跨代都不一定能单比ALU数量,前面那750 Ti白皮书里已经证明了这一点,虽然这是因为Kepler的一个缺陷特例。ROP的例子是前面说的Tesla 10和Fermi的对比。
因为你前面提到纸面性能我才去找的TPU那个链接,我只是说先不管R600的瓶颈,单看理论性能的话远不是G80的一半那么少而已,除非R600的实际浮点吞吐效率只有70%出头儿G80可以达到100%,但这也就让两者实际浮点吞吐相等而已。

TOP

实际上N家和A家斗法这十几年,两边最惨痛的,空前绝后的两次巨大失败NV30和R600的问题都在自己发挥失常,只是对手发挥超常把自己失常的问题进一步放大了而已

只要N和A自己不犯二,不论对手怎么猛,都不会再出现那么大的战略失败

TOP

引用:
原帖由 Nemo_theCaptain 于 2014-6-7 17:19 发表

R600弱到这个地步的主要原因是ROP有重大BUG,开了抗锯齿直接变成残废,连更老的显卡都没出现过这么离谱的问题
所以R700时代AMD重新设计了ROP,消除了BUG,为抗锯齿竭力优化
R600的纹理单元少了一些,在实际上依然 ...
芯片发热量的问题主要是由于HD2900搭载了512bit的位宽以及GDDR4显存

这两个玩意无论是规模还是发热量在当时都是非常庞大的存在(以G80的强悍,也只搭载了384bit的位宽和GDDR3显存就满足了需求,后期的G92更是精简到了256bit而依然保证了和G80持平的性能水准)

实际上由于HD2900的流处理器性能低下,这么大的带宽根本没有派上用场

而且HD2900XT更是走火入魔,把核心频率也拉到了740MHz(HD2900是600MHz),同时显存从512MB翻倍到了1GB,简直是火上浇油

[ 本帖最后由 KoeiSangokushi 于 2014-6-7 17:31 编辑 ]

TOP

引用:
原帖由 f0f0f0 于 2014-6-7 17:25 发表

这样比没意义,同厂家的跨代都不一定能单比ALU数量,前面那750 Ti白皮书里已经证明了这一点,虽然这是因为Kepler的一个缺陷特例。ROP的例子是前面说的Tesla 10和Fermi的对比。
因为你前面提到纸面性能我才去找的T ...
所以说你还是不够懂显卡

显卡这玩意,不同架构下的流处理器之间是有换算关系的

TOP

引用:
原帖由 Nemo_theCaptain 于 2014-6-7 17:25 发表
实际上N家和A家斗法这十几年,两边最惨痛的,空前绝后的两次巨大失败NV30和R600的问题都在自己发挥失常,只是对手发挥超常把自己失常的问题进一步放大了而已

只要N和A自己不犯二,不论对手怎么猛,都不会再出现那 ...
现在不是犯不犯2的问题,而是复杂度上去后跟不上了,就像美苏战机一样,差距只能是越来越大
amd以前的cpu也可以喝intel比一下,自从扣肉以后么...
amd在技术上能憋出gcn已经是最后一口气了,以现在的研发投入,到下代机出来的时候,能有小幅度提高就不错了

TOP

引用:
原帖由 KoeiSangokushi 于 2014-6-7 17:27 发表

所以说你还是不够懂显卡

显卡这玩意,不同架构下的流处理器之间是有换算关系的
有意义的就是实测浮点吞吐,一般宣传也就说SGEMM、DGEMM,没有什么一劳永逸的换算公式。

TOP

引用:
原帖由 f0f0f0 于 2014-6-7 17:32 发表

有意义的就是实测浮点吞吐,一般宣传也就说SGEMM、DGEMM,没有什么一劳永逸的换算公式。
换算公式在不同架构间都是变化的

浮点吞吐毫无意义

HD4850就达到了1T,比费米还高

TOP

引用:
原帖由 Nemo_theCaptain 于 2014-6-7 17:19 发表

R600弱到这个地步的主要原因是ROP有重大BUG,开了抗锯齿直接变成残废,连更老的显卡都没出现过这么离谱的问题
所以R700时代AMD重新设计了ROP,消除了BUG,为抗锯齿竭力优化
R600的纹理单元少了一些,在实际上依然 ...
印象中9600GT后期最多也就和3870比一下。

TOP

引用:
原帖由 yfl1 于 2014-6-7 17:21 发表
另外我一直觉得假设05年nv能拿出g80架构产品是一件很搞笑的事情,这事情天知地知,你肯定不知
其实要这么比的话,12年初的680论能耗比依然可以轻松超过现在的290系列,而amd要有新产品也要等15年了,也就是说,amd至 ...
05年NV能拿出G80架构产品一点都不搞笑
G80在06年春就流片成功了,之所以到06年春才搞定的原因不是架构先进,而是面积太大
如果NV为了主机等比缩减一个小核心,05年内就能流片,这样赶不上2005年的主机发售,但赶上2006年一点问题都没有

至于680,不要再让我提醒GK104降低双精度能力而Tahiti没降的事实
降低过双精度的Pitcairn能耗比超过一切开普勒(除了性能超弱的650Ti,但这没有比较的意义)

你要是觉得能耗比就是一切那我是不是可以说NV从R700到Cayman被AMD按在地上连续爆草了4代?从游戏玩家的角度来看这就是事实

TOP

引用:
原帖由 KoeiSangokushi 于 2014-6-7 17:33 发表

换算公式在不同架构间都是变化的

浮点吞吐毫无意义

HD4850就达到了1T,比费米还高
SP也好CC也好,比的就是浮点吞吐,ALU还比什么?既然有公式就说出来看看嘛,就NV而言,Kepler和Tesla、Tesla 10、Fermi、Maxwell都不一样。

TOP

发新话题
     
官方公众号及微博