打印

[新闻] AMD高级副总裁兼首席财务官透露下一代主机研发中，本代主机的生命周期可能会短一些

yfl1

小黑屋

帖子: 3504
精华: 0
积分: 1807
激骚: 40 度
爱车
主机
相机
手机
注册时间: 2013-3-12

发短消息
加为好友
当前离线

271^# 大中小发表于 2014-6-7 17:11 只看该作者

引用:

原帖由 KoeiSangokushi 于 2014-6-7 17:00 发表

再秒也不可能达到2006年HD2900纸面性能只有G80一半，高分辨率抗锯齿情况下只有四成，1年半之后的2008年初AMD拿出HD3870X2改进后的双GPU卡来还是只能在理论上达到G80单GPU同水平实际表现还是不如的差距

AMD最近6 ...

我不认为你这种推论对未来有什么借鉴价值，更无法否定差距拉大的可能性

TOP

f0f0f0

小侠

帖子: 228
精华: 0
积分: 4519
激骚: 223 度
爱车
主机
相机
手机
注册时间: 2010-8-4

发短消息
加为好友
当前在线

272^# 大中小发表于 2014-6-7 17:12 只看该作者

引用:

原帖由 KoeiSangokushi 于 2014-6-7 17:10 发表

不，我这里说的吞吐不是指浮点吞吐，而是指带宽吞吐

浮点这个概念从进入上个次世代起就在游戏中没有实际意义了，因为有太多DirectComputer相关的东西了，拿来算蛋白质挖矿倒是有用

我是说前面提的纸面性能一半的说法，上面那链接里也有纹理、像素填充率的理论值。

TOP

KoeiSangokushi

魔神至尊

帖子: 18238
精华: 0
积分: 26631
激骚: 140 度
爱车
主机
相机
手机
注册时间: 2007-10-17

PS区生还者入格奖☆ TGFC 2014新年勋章☆☆☆☆ TGFC 2015新年勋章☆☆☆☆ TGFC 2017新年勋章☆☆☆☆ TGFC 2018新年勋章☆☆☆☆

发短消息
加为好友
当前离线

273^# 大中小发表于 2014-6-7 17:13 只看该作者

引用:

原帖由 f0f0f0 于 2014-6-7 17:12 发表

我是说前面提的纸面性能一半的说法，上面那链接里也有纹理、像素填充率的理论值。

我已经解释了，就是GPU架构的规模

你说的纹理单元、像素填充率这些我没去看，因为瓶颈卡在了流处理器的渲染性能不足和ATI在当时不合理的光栅化单元设计所导致的低下抗锯齿性能上面

[ 本帖最后由 KoeiSangokushi 于 2014-6-7 17:15 编辑 ]

TOP

Nemo_theCaptain

元始天尊

帖子: 46768
精华: 17
积分: 64294
激骚: 7239 度
爱车
主机
相机
手机
注册时间: 2013-7-7

发短消息
加为好友
当前离线

274^# 大中小发表于 2014-6-7 17:19 只看该作者

引用:

原帖由 f0f0f0 于 2014-6-7 17:02 发表
纸面性能是指理论性能还是？

R600弱到这个地步的主要原因是ROP有重大BUG，开了抗锯齿直接变成残废，连更老的显卡都没出现过这么离谱的问题
所以R700时代AMD重新设计了ROP，消除了BUG，为抗锯齿竭力优化
R600的纹理单元少了一些，在实际上依然是贴图吃重的时代非常吃亏

另外就是R600的规模不足，无法通过规模掩盖流水线的延迟问题，所以后来AMD一直到Cayman的发展方向都是围绕如何铺大饼而转圈
其实R600规模不足倒不是根本性问题，320个流处理器虽然打不过9600GT，但和9600GSO掰腕子还是没问题的
关键问题在于芯片面积大，发热量大，成本高，和相对低下的性能根本不成正比
后来AMD针对这个规模芯片的措施就是疯狂减肥，芯片面积小了，打得起价格战，性价比和收益都上来了
R700时代AMD的策略就是320个主打低端，640个主打终端，800个主打高端
不过不管怎么折腾，320个流处理器对付高端的G80绝对没戏，要800个才能相抗衡，所以R600输了，而且输的非常彻底

[ 本帖最后由 Nemo_theCaptain 于 2014-6-7 17:20 编辑 ]

TOP

yfl1

小黑屋

帖子: 3504
精华: 0
积分: 1807
激骚: 40 度
爱车
主机
相机
手机
注册时间: 2013-3-12

发短消息
加为好友
当前离线

275^# 大中小发表于 2014-6-7 17:21 只看该作者

另外我一直觉得假设05年nv能拿出g80架构产品是一件很搞笑的事情，这事情天知地知，你肯定不知
其实要这么比的话，12年初的680论能耗比依然可以轻松超过现在的290系列，而amd要有新产品也要等15年了，也就是说，amd至少落后3年，这好像比当时还要吓人，当时1900系列还是可以好过7800系列的

TOP

f0f0f0

小侠

帖子: 228
精华: 0
积分: 4519
激骚: 223 度
爱车
主机
相机
手机
注册时间: 2010-8-4

发短消息
加为好友
当前在线

276^# 大中小发表于 2014-6-7 17:25 只看该作者

引用:

原帖由 KoeiSangokushi 于 2014-6-7 17:13 发表

我已经解释了，就是GPU架构的规模

这样比没意义，同厂家的跨代都不一定能单比ALU数量，前面那750 Ti白皮书里已经证明了这一点，虽然这是因为Kepler的一个缺陷特例。ROP的例子是前面说的Tesla 10和Fermi的对比。
因为你前面提到纸面性能我才去找的TPU那个链接，我只是说先不管R600的瓶颈，单看理论性能的话远不是G80的一半那么少而已，除非R600的实际浮点吞吐效率只有70%出头儿G80可以达到100%，但这也就让两者实际浮点吞吐相等而已。

TOP

Nemo_theCaptain

元始天尊

帖子: 46768
精华: 17
积分: 64294
激骚: 7239 度
爱车
主机
相机
手机
注册时间: 2013-7-7

发短消息
加为好友
当前离线

277^# 大中小发表于 2014-6-7 17:25 只看该作者

实际上N家和A家斗法这十几年，两边最惨痛的，空前绝后的两次巨大失败NV30和R600的问题都在自己发挥失常，只是对手发挥超常把自己失常的问题进一步放大了而已

只要N和A自己不犯二，不论对手怎么猛，都不会再出现那么大的战略失败

TOP

KoeiSangokushi

魔神至尊

帖子: 18238
精华: 0
积分: 26631
激骚: 140 度
爱车
主机
相机
手机
注册时间: 2007-10-17

PS区生还者入格奖☆ TGFC 2014新年勋章☆☆☆☆ TGFC 2015新年勋章☆☆☆☆ TGFC 2017新年勋章☆☆☆☆ TGFC 2018新年勋章☆☆☆☆

发短消息
加为好友
当前离线

278^# 大中小发表于 2014-6-7 17:26 只看该作者

引用:

原帖由 Nemo_theCaptain 于 2014-6-7 17:19 发表

R600弱到这个地步的主要原因是ROP有重大BUG，开了抗锯齿直接变成残废，连更老的显卡都没出现过这么离谱的问题
所以R700时代AMD重新设计了ROP，消除了BUG，为抗锯齿竭力优化
R600的纹理单元少了一些，在实际上依然 ...

芯片发热量的问题主要是由于HD2900搭载了512bit的位宽以及GDDR4显存

这两个玩意无论是规模还是发热量在当时都是非常庞大的存在（以G80的强悍，也只搭载了384bit的位宽和GDDR3显存就满足了需求，后期的G92更是精简到了256bit而依然保证了和G80持平的性能水准）

实际上由于HD2900的流处理器性能低下，这么大的带宽根本没有派上用场

而且HD2900XT更是走火入魔，把核心频率也拉到了740MHz（HD2900是600MHz），同时显存从512MB翻倍到了1GB，简直是火上浇油

[ 本帖最后由 KoeiSangokushi 于 2014-6-7 17:31 编辑 ]

TOP

KoeiSangokushi

魔神至尊

帖子: 18238
精华: 0
积分: 26631
激骚: 140 度
爱车
主机
相机
手机
注册时间: 2007-10-17

PS区生还者入格奖☆ TGFC 2014新年勋章☆☆☆☆ TGFC 2015新年勋章☆☆☆☆ TGFC 2017新年勋章☆☆☆☆ TGFC 2018新年勋章☆☆☆☆

发短消息
加为好友
当前离线

279^# 大中小发表于 2014-6-7 17:27 只看该作者

引用:

原帖由 f0f0f0 于 2014-6-7 17:25 发表

这样比没意义，同厂家的跨代都不一定能单比ALU数量，前面那750 Ti白皮书里已经证明了这一点，虽然这是因为Kepler的一个缺陷特例。ROP的例子是前面说的Tesla 10和Fermi的对比。
因为你前面提到纸面性能我才去找的T ...

所以说你还是不够懂显卡

显卡这玩意，不同架构下的流处理器之间是有换算关系的

TOP

yfl1

小黑屋

帖子: 3504
精华: 0
积分: 1807
激骚: 40 度
爱车
主机
相机
手机
注册时间: 2013-3-12

发短消息
加为好友
当前离线

280^# 大中小发表于 2014-6-7 17:29 只看该作者

引用:

原帖由 Nemo_theCaptain 于 2014-6-7 17:25 发表
实际上N家和A家斗法这十几年，两边最惨痛的，空前绝后的两次巨大失败NV30和R600的问题都在自己发挥失常，只是对手发挥超常把自己失常的问题进一步放大了而已

只要N和A自己不犯二，不论对手怎么猛，都不会再出现那 ...

现在不是犯不犯2的问题，而是复杂度上去后跟不上了，就像美苏战机一样，差距只能是越来越大
amd以前的cpu也可以喝intel比一下，自从扣肉以后么...
amd在技术上能憋出gcn已经是最后一口气了，以现在的研发投入，到下代机出来的时候，能有小幅度提高就不错了

TOP

f0f0f0

小侠

帖子: 228
精华: 0
积分: 4519
激骚: 223 度
爱车
主机
相机
手机
注册时间: 2010-8-4

发短消息
加为好友
当前在线

281^# 大中小发表于 2014-6-7 17:32 只看该作者

引用:

原帖由 KoeiSangokushi 于 2014-6-7 17:27 发表

所以说你还是不够懂显卡

显卡这玩意，不同架构下的流处理器之间是有换算关系的

有意义的就是实测浮点吞吐，一般宣传也就说SGEMM、DGEMM，没有什么一劳永逸的换算公式。

TOP

KoeiSangokushi

魔神至尊

帖子: 18238
精华: 0
积分: 26631
激骚: 140 度
爱车
主机
相机
手机
注册时间: 2007-10-17

PS区生还者入格奖☆ TGFC 2014新年勋章☆☆☆☆ TGFC 2015新年勋章☆☆☆☆ TGFC 2017新年勋章☆☆☆☆ TGFC 2018新年勋章☆☆☆☆

发短消息
加为好友
当前离线

282^# 大中小发表于 2014-6-7 17:33 只看该作者

引用:

原帖由 f0f0f0 于 2014-6-7 17:32 发表

有意义的就是实测浮点吞吐，一般宣传也就说SGEMM、DGEMM，没有什么一劳永逸的换算公式。

换算公式在不同架构间都是变化的

浮点吞吐毫无意义

HD4850就达到了1T，比费米还高

TOP

f0f0f0

小侠

帖子: 228
精华: 0
积分: 4519
激骚: 223 度
爱车
主机
相机
手机
注册时间: 2010-8-4

发短消息
加为好友
当前在线

283^# 大中小发表于 2014-6-7 17:33 只看该作者

引用:

原帖由 Nemo_theCaptain 于 2014-6-7 17:19 发表

R600弱到这个地步的主要原因是ROP有重大BUG，开了抗锯齿直接变成残废，连更老的显卡都没出现过这么离谱的问题
所以R700时代AMD重新设计了ROP，消除了BUG，为抗锯齿竭力优化
R600的纹理单元少了一些，在实际上依然 ...

印象中9600GT后期最多也就和3870比一下。

TOP

Nemo_theCaptain

元始天尊

帖子: 46768
精华: 17
积分: 64294
激骚: 7239 度
爱车
主机
相机
手机
注册时间: 2013-7-7

发短消息
加为好友
当前离线

284^# 大中小发表于 2014-6-7 17:34 只看该作者

引用:

原帖由 yfl1 于 2014-6-7 17:21 发表
另外我一直觉得假设05年nv能拿出g80架构产品是一件很搞笑的事情，这事情天知地知，你肯定不知
其实要这么比的话，12年初的680论能耗比依然可以轻松超过现在的290系列，而amd要有新产品也要等15年了，也就是说，amd至 ...

05年NV能拿出G80架构产品一点都不搞笑
G80在06年春就流片成功了，之所以到06年春才搞定的原因不是架构先进，而是面积太大
如果NV为了主机等比缩减一个小核心，05年内就能流片，这样赶不上2005年的主机发售，但赶上2006年一点问题都没有

至于680，不要再让我提醒GK104降低双精度能力而Tahiti没降的事实
降低过双精度的Pitcairn能耗比超过一切开普勒（除了性能超弱的650Ti，但这没有比较的意义）

你要是觉得能耗比就是一切那我是不是可以说NV从R700到Cayman被AMD按在地上连续爆草了4代？从游戏玩家的角度来看这就是事实

TOP

f0f0f0

小侠

帖子: 228
精华: 0
积分: 4519
激骚: 223 度
爱车
主机
相机
手机
注册时间: 2010-8-4

发短消息
加为好友
当前在线

285^# 大中小发表于 2014-6-7 17:35 只看该作者

引用:

原帖由 KoeiSangokushi 于 2014-6-7 17:33 发表

换算公式在不同架构间都是变化的

浮点吞吐毫无意义

HD4850就达到了1T，比费米还高

SP也好CC也好，比的就是浮点吞吐，ALU还比什么？既然有公式就说出来看看嘛，就NV而言，Kepler和Tesla、Tesla 10、Fermi、Maxwell都不一样。

TOP