» 您尚未登录:请 登录 | 注册 | 标签 | 帮助 | 小黑屋 |


发新话题
打印

转贴,卡马克密码。

LS,多数有该功能的Gpu的rsqrt是1 cycle throughput。哪个更快不言而喻。
令:即使是p4的SSE中的4d rsqrt,也就是latency6 througput4的样子。


TOP

发新话题
     
官方公众号及微博