» 您尚未登录:请 登录 | 注册 | 标签 | 帮助 | 小黑屋 |


 20 12
发新话题
打印

黄仁勋说5070=4090,你们信么

posted by 论坛助手, platform: iPhone
果然是dlss4新特性独占

附件: 您所在的用户组无法下载或查看附件


TOP

posted by wap, platform: Android
那国内行货最高只能买到5070D?



TOP

狗屁不通就别为难自己回帖了

商务部管制标准是TPP,也就是tops*位宽

70和90位宽是一样的吗就禁运


TOP

引用:
原帖由 defer 于 2025-1-7 13:51 发表
狗屁不通就别为难自己回帖了

商务部管制标准是TPP,也就是tops*位宽

70和90位宽是一样的吗就禁运
对于RTX 4090 D的性能,目前英伟达并没有给出信息,不过我们可以从此前的禁令条例来推测一下,RTX 4090被禁的主要原因是以TPP(性能密度)来计算的话,其TPP达到5286,而条例限制了所有TPP高于4800的显卡在大陆生产及销售。从TPP来看,RTX 4090大约超过了限制线10%。

那么,是否把RTX 4090的性能降低10%,就可以恢复销售呢?理论上是这样没错,RTX 4090采用的AD102核心,拥有128个SM单元,通过换算,只需要将SM单元数量削减到108个,那么这颗新显卡核心的TTP就会降低到4778,恰好略低于限制线。

去年10月7日实施的出口管制版本,主要是限制“处理性能”和“互连带宽”,处理性能限制阈值是所有处理器单元的“位宽x算力(bits x TOPS)”总和≥4800,互连带宽的限制阈值是总双向传输速率达到或可编程到≥600Gb/s。
为了合规,英伟达、英特尔都采取了向中国市场推出“降速版”AI芯片的措施:英伟达将对华销售的H800/A800互连带宽速度从H100/A100的600Gb/s降到400Gb/s,英特尔将对华销售的AI训练芯片Gaudi2集成以太网端口数量从国际版的24个降至21个。
此次新规进一步收紧,不限制“互连带宽”了,改为限制“性能密度”,并用“总处理性能(TPP)”来取代之前的“位宽x算力”。根据ECCN 3A090修正,满足以下任一条件,就会受出口限制:


TPP、性能密度怎么算?
根据注释,3A090规定的芯片类型包括图形处理器(GPU)、张量处理器(TPU)、神经处理器、存内处理器、视觉处理器、文本处理器、协处理器、自适应处理器、现场可编程逻辑器件(FPLD)、专用集成电路(ASIC)。
具体计算方法为,“总处理性能(TPP)”是2 דMacTOPS”ד操作位长度”,在集成电路上的所有处理单元上相加。对于3A090规定的同时提供稀疏矩阵和密集矩阵处理的芯片,“TPP”值是处理密集矩阵(如无稀疏性)的值。
“性能密度”即TPP除以“适用die面积”。“适用die面积”以mm²为单位测量,包括使用非平面晶体管架构的工艺节点制造的逻辑die的所有die面积。
“MacTOPS”是用于乘法累加计算(D=AxB+C)的每秒Tera(10^12)操作的理论峰值数。“TPP”公式中的2基于将一次乘法累加计算(D=AxB+C)作为2次操作的行业惯例。
因此,2 × MacTOPS可能对应于数据表上报告的TOPS或FLOPS。乘法累加计算的“操作位长度”是乘法操作输入的最大位长度。
“MacTOPS”的比率应按理论上可能的最大值计算,被假定是制造商在年度或集成电路宣传册中宣称的最高值。例如,“TPP”阈值4800可通过8位600tera整数运算(或2×300MacTOPS)或16位300teraFLOPS(或2×150MacTOPS)来实现。如果芯片设计用于MAC计算,具有实现不同“TPP”值的多个位长度,则应根据3A090中的参数评估最高的“TPP”值。
出口管制新规还为具有AI功能的消费级芯片增加了经通报的先进计算许可例外(NAC)。此许可例外适用于3A090.b和3A090.a规则下的芯片,即在收到向中国等地出口、再出口及转运的通报后,美国政府将决定是否可以适用该许可例外或需要许可证。

[ 本帖最后由 yfl2 于 2025-1-7 14:33 编辑 ]

TOP

posted by wap, platform: Chrome
我的4090的性价比已经为0了,5090只要1999美元!!!!

TOP

 20 12
发新话题
     
官方公众号及微博