» 您尚未登录:请 登录 | 注册 | 标签 | 帮助 | 小黑屋 |


发新话题
打印

5090奇葩问题,丢了8个ROP单元

如果按照cuda核心算,168组rop其实至只少了2组,基本没啥区别,没说的那么多,少了8组。

5090按照21760个cuda核心数目算,其实是170组rop,21760/128=170组,168组也就少了2组,基本没区别。每个rop都有1个rt core,规格上写的rt core数目也是170个,跟cuda核心对应的rop数目是没有区别的。

但是按照gpc算,确实应该是176个rop,满血的gb202核心,是12组gpc,每组gpc有16个rop,每个rop是128个cuda核心,12x16x128=24576个cuda核心。
5090的规格说是启用了11组gpc,11x16=176个rop,但是176个rop是176x128=22528个cuda核心,而5090的cuda核心数目是21760个,应该是有一组gpc只用了16个rop里的10组,
10*16*128+1*10*128=21760个cuda核心,正好是21760个cuda核心,为啥最后1组16个不全部开放,还屏蔽了6个,只给你10个,就不清楚是什么原因了。

168组rop就是最后一组gpc开放了一半的rop,按对称设计来说反而好像更合理。

[ 本帖最后由 senooo 于 2025-2-22 10:12 编辑 ]


TOP

发新话题
     
官方公众号及微博