posted by wap, platform: iPhone引用:
原帖由 @CASEY123 于 2022-12-19 11:22 发表
4090才80t
此T非彼T,不是一回事,前面我解释过了
以英伟达显卡的架构为例,里面的cuda core是通用型浮点运算单元,tensor core专门做深度学习矩阵运算。玩游戏做图形运算只要cuda核就够了,自动驾驶做深度学习主要靠堆Tensor core。
前者的算力可以直接换算成显卡和游戏机参数里的的TFlops。后者的算力除了考虑运行的模型还要考虑计算精度,Orin所谓254TOPS是在int8下,换成全精度FP32下只有1/4的算力,远不如80,90系顶级显卡。