其实说VLIW2有点勉强,跟传统VLIW没关系,只是一个SIMD内部调度改动、去年农企发布的新专利
这玩意也是建立在GCN上,传统GCN我们都知道是CU组成是一组矢量SIMD+一个标量单元,VLIW2改成两组矢量SIMD并增加一个CU内高速缓存,这类似于AMD的Bulldozer微架构;其中两个或多个ALU组合在一起。 ALU可以是完整的ALU或部分ALU。这里的主要区别是使用小型高速缓存固定在组上。缓存允许操作的结果立即传递到组中的另一个ALU,跳过L1缓存。
这种结构能够从单个或多个线程执行多于一个指令,并且包括多个向量通用寄存器(VGPR),卧槽越来越像挖土机的单模块双单元结构
好处是GCN底层不用大改就能突破4096SP天花板,40CU就能有5120SP,并且每CUs分配的前端资源可以大大增加提升游戏实际性能,代价当然是驱动兼容性和游戏优化需要有不小的改动,我看以农企的能力没个2年基本搞不定,游戏机这块倒没啥问题,向下兼容用单组SIMD模式就行了,最后送上农企专利图感觉跟挖土机一模一样
附件: 您所在的用户组无法下载或查看附件