» 您尚未登录:请 登录 | 注册 | 标签 | 帮助 | 小黑屋 |


发新话题
打印

看见个关于浮点运算的新闻~以前一直看DR提到浮点运算的~

 根据Nvidia公布的G70资料显示,Vertex Shader引擎具备4路 VLIW单元和1个梯状单元,可以并行处理5个数据;故计算得知一个周期内包括10个浮点指令操作,而G70的Vertex Shader引擎数目是8条,因此,最近计算得到的G70浮点运算能力为:

  (4路 1梯形) X 2FP(浮点操作 MADD) = 10FP/周期;10个FP(浮点操作)×8Shader×430MHz=34.4GFlops

  而G70的Pixel Shader引擎中,具备2个梯形操作单元以及4路×2 SIMD单元,此外还拥有可以处理处理算数指令(mini ALU)的FP16规格化处理单元(共7路),因此,G70的Pixel Shader引擎浮点效能如下:

  ((4路 x 2 单元 2梯形单元) x 2 FP) 7 规格化处理器单元 = 27 FP操作/周期:27 FP x 24 Shader x 430MHz = 278.6GFLOPS

  有了这样的计算公式,我们可以很轻松地计算出频率为550MHz的RSX的Vertex Shader和Pixel Shader引擎的浮点运算能力:

  Vertex Shader

  10 FP x 8 Shader x 550MHz = 44GFLOPS

  Pixel Shader

  27 FP x 24 Shader x 550MHz = 356.4GFLOPS

  总共为44GFLOPS 356.4GFLOPS = 400.4GFLOPS


TOP

发新话题
     
官方公众号及微博