» 您尚未登录:请 登录 | 注册 | 标签 | 帮助 | 小黑屋 |


发新话题
打印

[新闻] TPU:5090出现零售不良品,屏蔽了8个ROP(光栅化处理单元)导致性能下降5.6%

5090按照21760个cuda核心数目算,其实是170组rop,21760/128=170组,168组也就少了2组,基本没区别。每个rop都有1个rt core,规格上写的rt core数目也是170个,跟cuda核心对应的rop数目是没有区别的。

但是按照gpc算,确实应该是176个rop,满血的gb202核心,是12组gpc,每组gpc有16个rop,每个rop是128个cuda核心,12x16x128=24576个cuda核心。
5090的规格说是启用了11组gpc,11x16=176个rop,但是176个rop是176x128=22528个cuda核心,而5090的cuda核心数目是21760个,应该是有一组gpc只用了16个rop里的10组,
10*16*128+1*10*128=21760个cuda核心,正好是21760个cuda核心,为啥最后1组16个不全部开放,还屏蔽了6个,只给你10个,就不清楚是什么原因了。

附件: 您所在的用户组无法下载或查看附件


TOP

发新话题
     
官方公众号及微博