Board logo

标题: [新闻] AMD 踢爆三红秘密(AMD详解GPU封装缺陷问题起源) [打印本页]

作者: hmony    时间: 2008-10-17 09:10     标题: AMD 踢爆三红秘密(AMD详解GPU封装缺陷问题起源)

不能不说MS的XBOX360的GPU啦,MS自己流片而没有请别人来帮忙
一个硬件盲做这事当然有所出错,但想NV这样的GPU生产厂商自己的
CPU都出现问题就说不过去了。
下面就是AMD在解说的内容:




今年夏天,NVIDIA在财报会议上承认,由于部分移动GPU产品在封装过程中存在问题,导致使用中可能出现问题。戴尔、惠普、苹果等厂商随之先后宣布对搭载部分GeForce 8系列显卡的笔记本提供免费维修服务。
这一问题说来奇怪,NVIDIA和AMD这一对竞争对手在GPU制造上依赖的都是台积电等台湾厂商,从代工工厂、封装工厂到所用工艺几乎完全相同。为什么单单NVIDIA的GPU出现问题,AMD却能够独善其身呢?日前,AMD公司专门负责封装和互联技术的主管NeilMcLellan接受了媒体的采访,对AMD在GPU封装中采用的技术进行了介绍,从一个侧面也解释了NVIDIA出现这种问题的原因。
要谈这个问题,首先需要从被AMD收购之前的ATI说起。当时由于在游戏主机中使用的GPU封装材料出现问题,再加上欧盟提出的RoHS环保条例开始限制半导体封装中的有害金属应用,ATI雇佣了NeilMcLellan专门主管封装工艺问题。从2005年开始,RoHS要求封装后的GPU在与PCB板焊接时采用无铅锡球(SolderBall)。趁这个机会,AMD也将GPU Die与基板封装时的所用的焊接凸点(Solder Bump)材料从高铅凸点转换为低熔点锡铅凸点。

高铅凸点含有90%的铅和10%的锡,而低熔点铅锡凸点的构成是37%的铅和63%的锡。铅能够承载更多的电流,但AMD认为高铅凸点更易老化,在可靠性上有所欠缺。特别是在温度快速变化时,使用高铅凸点封装的GPU容易出现问题。出现这种情况的原因是,从硅晶圆上切割下来的GPU芯片与封装基板之间存在热胀冷缩率的差异,硅芯片为每摄氏度百万分之二,而封装基板为每摄氏度百万分之三十。这种差异导致温度变化时连接芯片与基板的凸点承受了相当大的拉力,久而久之就容易出现问题。
低熔点锡铅凸点避免了这种问题的发生,但它也有自己的缺点。比如,它的高电流承载能力不如高铅凸点,在出现高电流时容易出现电子迁移现象。由于GPU个部分有不同的功耗,因此经过有些凸点电流可能只有50mA,而有些凸点此时可能达到600mA。为避免电流过载,AMD在凸点和芯片之间增加了一层金属,重新对电流进行平均分配。
无论AMD还是NVIDIA的GPU,封装工作都是在矽品、日月光等厂商中进行的,不同厂商往往采用不同的工艺或材料。AMD在决定使用新的封装设计与材料后,将设计规范提供给封装厂商要求它们遵守。封装厂商方面,虽然愿意按照客户的要求进行制造,但他们并不对由此可能产生的后果负责。当然从现在来看,AMD使用的低熔点锡铅凸点工艺并没有出现什么问题。而且,新工艺制造成本更低,良品率更高。“从财务上来看,我们没有理由不采取一种更加可靠的封装技术”。
反观NVIDIA,虽然NeilMcLellan并不愿意过多评论竞争对手。但还是可以从他的话中听出,NVIDIA并不太重视封装工艺问题。他认为NVIDIA的移动GPU应当采用的是高铅凸点,在笔记本中使用温度经常快速变化,导致了问题的发生。而桌面版本虽然散热状况没有笔记本那么恶劣,但在长期使用后仍然不免出现同样的问题。
未来,RoHS规范将于2010年要求芯片制造过程中无论锡球还是凸点均要采用无铅工艺,AMD的一些客户甚至要求更早实现该目标。McLellan表示,这将是一个全新的问题,并且更加艰巨。他已经为此工作了一年半的时间,而NVIDIA应当也已经付出了同样的时间和精力来解决封装设计问题。
作者: Dinosino    时间: 2008-10-17 09:53

其实说白了AMD是被MS的三红吓坏了然后才想起找到这哥们专门研究封装技术,因祸得福啊。要不然RV770那变态晶体管密度和发热,估计难逃G84的厄运。NV阴沟翻船和MS何其相似。
作者: 杀气腾腾    时间: 2008-10-17 09:56

恩。。。专业性很高。。。
作者: neeze    时间: 2008-10-17 09:59

多给些钱给intel
什么问题都没有
作者: qianyuting    时间: 2008-10-17 10:16

太专业,没看懂!
作者: 测试一下    时间: 2008-10-17 10:21

ATI也是出了错才发现的吧...
作者: 262674    时间: 2008-10-17 10:30

等阵
按理a卡、n卡都有问题
怎么老任用的就是a卡,没事。ps3用n卡,又没事?
作者: 倍舒爽    时间: 2008-10-17 10:32

三红了这么久,官方终于有说法拉。。。
意味着啥呢???

以后的批次绝不三红吗?头顶晴天咯!!!
作者: 测试一下    时间: 2008-10-17 10:37

引用:
原帖由 262674 于 2008-10-17 10:30 发表
等阵
按理a卡、n卡都有问题
怎么老任用的就是a卡,没事。ps3用n卡,又没事?
N卡宣布的是G86M和G84M有问题...

RSX虽然不知道...

不过怎么也是G7X吧...
作者: 262674    时间: 2008-10-17 10:40

原来如此
作者: shiningfire    时间: 2008-10-17 10:43

mb 俺就是8600m
作者: 自然韵律    时间: 2008-10-17 22:38

techreport下面的回复有很多不同意见阿。不论怎么说,lead-free的确是大势所趋。

----------
Just adding to this. AMD's CPU division uses High-Pb solder themselves. Did Neil comments on this?
This GPU failure thing is getting uglier by the day. I suspect Nvidia is withholding information so they can prepare to sue their subcons.
AMD (Neil) is making these comment at this stage to prevent the fire from burning to their yard. Other than the eutectic versus Hi-Pb issue, everyone in the industry uses the same or very similar Bill of Materials (everyone who use TSMC, UMC, SPIL and ASE)!
The NV gpu failures are not materials related, they are design (IC and thermal) related.
-------------

I have read the internal reports at Nvidia. The failures are pin specific to the pcix bus and it is mostly chipset related (c51).
Pin specific failures cannot bedue to packaging material. Failures due to packaging material should berandom pins near the corners of the die.
Let's see when Nvidia will come clean.
Ifyou want to do your own research on Hi-Pb versus eutectic Sn-Pb solder bump reliability, go to IEEE database or your local university libraryand look up "High Lead", "Eutectic", "ElectroMigration", "Finite Element", "Thermo Fatigue". Read these articles yourself.

Highlead solder has 50 years of history from the IBM days. Niel Mclellan ISa hack. He stole credits from his engineers on numerous patents that he holds.
-------------

Most likely - similar to the Samsung VRAM BGA issue
http://www.google.com/search?hl=en&q=samsung+bga+failures&aq=f&oq=s...
The repair tech working on my personal laptop (for 3 months...) reports that the packaging is simply too thin and can't handle the long term thermal dynamics of the circuit while in operation. Sounds like nVidia may have gone down the same road.
-------------
开始质疑Niel Mclellan的人品了~
Niel Mclellan used to be my boss in my previous company. He's a hack and doesn't know what he's talking about; he relies on engineers below him to tell him what to say. I have not seen a single engineering observation from this guy the three years I've been working for him. How he got to where he is? God knows?
If you actually read academic studies and participate in engineering, you would know that high-lead solder is much more reliable to fatigue,electro-migration, and also creates a much less stressful package dueto the decrease in collapse height during processing. Going with eutectic solder is only for cost reduction and only for small die size applications.
-----------

[ 本帖最后由 自然韵律 于 2008-10-17 22:50 编辑 ]
作者: cangying    时间: 2008-10-18 00:21

那么也就是说XB360是使用高铅凸点封装的GPU,由于GPU个部分有不同的功耗,如播放DVD电影时功耗很底,但玩游戏时却功耗很大(由于GPU个部分有不同的功耗,因此经过有些凸点电流可能只有50mA,而有些凸点此时可能达到600mA,硅芯片为每摄氏度百万分之二,而封装基板为每摄氏度百万分之三十。这种差异导致温度变化时连接芯片与基板的凸点承受了相当大的拉力,久而久之就容易出现问题。
),GPU和主板之间容易意脱焊,因此造成3红?
作者: 责任编辑    时间: 2008-10-18 00:51

不懂!!!
作者: 水番晓月    时间: 2008-10-18 06:34

引用:
原帖由 自然韵律 于 2008-10-17 22:38 发表
If you actually read academic studies and participate in engineering, you would know that high-lead solder is much more reliable to fatigue,electro-migration, and also creates a much less stressful package dueto the decrease in collapse height during processing. Going with eutectic solder is only for cost reduction and only for small die size applications.
engineering major 的来证实一下这段呗
作者: HyperIris    时间: 2008-10-18 07:10

引用:
原帖由 cangying 于 2008-10-18 00:21 发表
那么也就是说XB360是使用高铅凸点封装的GPU,由于GPU个部分有不同的功耗,如播放DVD电影时功耗很底,但玩游戏时却功耗很大(由于GPU个部分有不同的功耗,因此经过有些凸点电流可能只有50mA,而有些凸点此时可能达到6 ...
360 应该是更脆弱的无铅锡球
作者: 我是我的马甲    时间: 2008-10-18 07:11

用的8600.会不会挂掉.
作者: 心之一方    时间: 2008-10-19 09:57

回头问问俺的供应商去
作者: jump    时间: 2008-10-19 13:56

麻痹……老子就是8600m……
作者: zhangyunsony    时间: 2008-10-21 05:07

看不懂
不过要拜一下技术贴
作者: Dinosino    时间: 2008-10-21 09:17

G84序列的才会三红,G94系列的INQ的说法是存在瑕疵,但是没说是这个问题。总之一句话,NV最近工艺问题确实比较多。ATI是因为AMD玩了多年CPU有些经验,不然早进去了,看看R600那高耗低能吧,简直比当年的5800还垃圾。
作者: Dinosino    时间: 2008-10-21 09:18

最可耻的是天朝的G84产品除了水果牌之类的就没啥补偿措施,集体缄默只当没这回事,JS们还拼命向大家推荐这类产品。
作者: Dinosino    时间: 2008-10-21 09:21

引用:
原帖由 262674 于 2008-10-17 10:30 发表
等阵
按理a卡、n卡都有问题
怎么老任用的就是a卡,没事。ps3用n卡,又没事?
任天堂的A卡那点儿晶体管也会有问题的话AMD别混了,流片就是AMD负责。
N用的RSX就是G7X缩水版,成熟产品怎么会出问题?只能说神机运气好,如果当初加老黄码给高点儿说不定捡上G86或者G84直接就套牢了,RSX的封装方式和移动处理器基本一样。
作者: lancky    时间: 2008-10-21 09:45

说白了大门完全不懂硬件又一心只想省钱,给人类工业历史抹上了一黑红,是否可以这么说?
作者: 水星的爱    时间: 2008-10-21 10:52

会不会XBOX360的GPU承担了更多的工作,而且变动较大,所以在使用中的温度变化更大,导致焊脚融化松动?
作者: aquasnake    时间: 2008-10-22 00:30

XBO应该是ROHS无铅焊接工艺,比PS3需要的回流温度高。

但是工厂一般接单在转换ROHS工艺时,会忽视了炉稳曲线的修正,这样可能引起焊接瑕疵,在瞬间温差变化大的时候焊接的脆弱部分会脱焊。这个就是三红的故障原因。

AMD是把自己的有铅工艺硬是说成了无铅,虽然有铅焊接熔点更低更易于焊接/但欧盟的铅限制禁令也是迫使IC设计走向低供耗化。
作者: squaredong    时间: 2008-10-23 01:30

引用:
原帖由 262674 于 2008-10-17 10:30 发表
等阵
按理a卡、n卡都有问题
怎么老任用的就是a卡,没事。ps3用n卡,又没事?
因为老任的A卡是N年前的产物,只是加大了频率罢了,PS3的N卡也是几年前的产品了,所以也不会有这些问题。
作者: hh123    时间: 2008-10-23 02:17

从侧面说明了RSX性能低下
作者: Dinosino    时间: 2008-10-23 09:12

引用:
原帖由 lancky 于 2008-10-21 09:45 发表
说白了大门完全不懂硬件又一心只想省钱,给人类工业历史抹上了一黑红,是否可以这么说?
NV的G84、86照阁下的意思也是老黄不懂硬件喽?看半天你看明白啥了?
如果是有铅的焊锡熔点再高些,膨胀系数低些就不会那么容易脱焊了。流片环节很多问题靠的是经验而不是设计水平,NV如果有封装方面的专门人员的话就不会最近丢了3亿多美元进去摆平糗事了。根本不是NV不会设计逻辑电路,问题就出在小小的封装材料上,而且是根本不值钱的不起眼玩意惹的祸。

[ 本帖最后由 Dinosino 于 2008-10-23 09:15 编辑 ]




欢迎光临 TGFC Lifestyle (http://bbs.tgfcer.com/) Powered by Discuz! 6.0.0