» 您尚未登录:请 登录 | 注册 | 标签 | 帮助 | 小黑屋 |


发新话题
打印

[新闻] 一些PS5的爆料

引用:
原帖由 u571 于 2020-2-16 12:16 发表



这有啥奇葩的,Larrabee不也是这种思维方式,最终Cell和Larrabee完蛋的最关键原因还是Sony和intel根本不知道光栅化渲染到底是怎么回事

拿通用SIMD单元完全取代固定光栅化功能这不是脑子有屎么,别看显卡吹什 ...
做完全一样的事情ASIC能效更高纯属废话。
用可编程管线的目的自然就是在保持对旧流程兼容的情况下还可以改变流程本身。

这也是为啥能效被NPU百倍碾压,但CPU在深度学习中仍旧非常重要,英特尔仍旧要在CPU里加入大量关于深度学习的加速指令的原因。
因为CPU跑深度学习精度可调,规模可调,递归策略不受限制。

其实NV目前用于图形的固定管线已经包括光栅化、光追和深度学习三种,如果以后固定管线的种类还有更多呢,如果不一应用里三类或多类固定计算的需求的比例极端不同,资源能调整就好了呢?
当然,这个需求通用计算管线也不是最佳选择,FPGA才是最适合的,英特尔压重注的三个未来十年计算方案之一就包括Altera组的FPGA,也是目前10nm工艺出货的核心。


TOP

引用:
原帖由 yfl2 于 2020-2-16 12:24 发表

你的意思是,索尼自研的ee比ati给ngc的要更先进,能耗比更高是么
今非昔比了,SGI图形部门曾是opengl的灵魂,在当时算是世界上最理解3D图形学的人,到了ati手里后首作9000系就反转局面。

至于EE,EE当时其实瓶颈明显,向量单元没有能力跑复杂逻辑还只能等cpu喂活,结果1cpu拖2向量都很难用,没有潜力。

Cell最激进的地方就是ppe的无缓存设计,依靠延迟极低的本地SRAM进行计算,在有了完全可预知的计算延迟后顺序执行成了更好选择。
这可比larrabee这个基于传统缓存设计,只从GPU学到靠fmt隐藏计算延迟的铁憨憨有潜力多了。
Cell作为编程自由度远高于现代GPU的真CPU设计,但是浮点能效却完全不输当时连通用计算能力都没的老GPU,不得不说没有后续发展着实可惜。



TOP

引用:
原帖由 卖哥 于 2020-2-16 12:40 发表

做完全一样的事情ASIC能效更高纯属废话。
用可编程管线的目的自然就是在保持对旧流程兼容的情况下还可以改变流程本身。

这也是为啥能效被NPU百倍碾压,但CPU在深度学习中仍旧非常重要,英特尔仍旧要在CPU里加入 ...
Larrabee的技术几年前拿去做了Xeon Phi,是一张和图像无关的运算卡,本质上就是把几十上百个Atom CPU堆在一起
一开始还是走PCI-E插槽的,后来索性直接成了CPU
从这个角度来说也不算太失败,只不过Xeno Phi与图像没关系了


TOP

引用:
原帖由 卖哥 于 2020-2-16 12:40 发表

做完全一样的事情ASIC能效更高纯属废话。
用可编程管线的目的自然就是在保持对旧流程兼容的情况下还可以改变流程本身。

这也是为啥能效被NPU百倍碾压,但CPU在深度学习中仍旧非常重要,英特尔仍旧要在CPU里加入 ...
CPU现在跑深度学习绝大多数模型都远差于GPU,要不然老黄Q4服务器市场怎么会卖的这么好?牙膏厂为什么还要重新做GPU?

另外固定功能单元对于GPU晶体管面积占用并不高,例如RT core只占SM面积7%,看GPU电子显微镜图里流处理器和RAM占据基本80%面积,固定功能单元并不吃晶体管而是吃设计和驱动设计,看看农企5700XT到现在驱动还烂的跟坨狗屎一样,真不知道再加上光追的RDNA2会成什么模样

TOP

引用:
原帖由 Nemo_theCaptain 于 2020-2-16 12:55 发表

Larrabee的技术几年前拿去做了Xeon Phi,是一张和图像无关的运算卡,本质上就是把几十上百个Atom CPU堆在一起
一开始还是走PCI-E插槽的,后来索性直接成了CPU
从这个角度来说也不算太失败,只不过Xeno Phi与图像 ...
其实Xeon Phi做计算卡也不行,根本没卖出几个项目,早早的就停产了

说白了,Xeon Phi这种多核做计算密集型项目简直脱裤子放屁,计算性能能耗比不如GPU、CPU单核性能又远低于传统服务器CPU,谁会用这种毫无比较优势的玩意

牙膏厂近10年最失败的X86产品Xeon Phi和Atom可以并列第一,甚至Atom好歹在低功耗服务领域还有些东西,Xeon Phi妥妥的就完全是一堆电子垃圾

TOP

引用:
原帖由 Nemo_theCaptain 于 2020-2-16 12:55 发表

Larrabee的技术几年前拿去做了Xeon Phi,是一张和图像无关的运算卡,本质上就是把几十上百个Atom CPU堆在一起
一开始还是走PCI-E插槽的,后来索性直接成了CPU
从这个角度来说也不算太失败,只不过Xeno Phi与图像 ...
Xeno Phi在我看来是不怎么成功的

其实同期也有一个类似Cell思想的拿小cpu核心基于本地sram计算的众核设计。
SW26010,在工艺落后2代的情况下,能效比英特尔phi更好。

Cell如果发展下去绝对要比SW强得多。
拿19级固定流水线取代8~11级动态流水线,频率起码提升60%,工艺升两级频率起码再提升30%然后核心数翻倍,用HBM取代带宽严重瓶颈的8通道DDR3。
欧美一线设计团队,拿主流水平造一个4+256的类Cell众核,能效相对于SW26010绝对有3~4倍的提升空间,而Xeon phi却连条件严重不达标的SW26010都打不过。

TOP

引用:
原帖由 卖哥 于 2020-2-16 12:55 发表

今非昔比了,SGI图形部门曾是opengl的灵魂,在当时算是世界上最理解3D图形学的人,到了ati手里后首作9000系就反转局面。

至于EE,EE当时其实瓶颈明显,向量单元没有能力跑复杂逻辑还只能等cpu喂活,结果1cpu拖2 ...
哦,你还知道今非昔比
说说10年内索尼设计过的cpu gpu如何

TOP

引用:
原帖由 yfl2 于 2020-2-16 14:07 发表

哦,你还知道今非昔比
说说10年内索尼设计过的cpu gpu如何
现在不是收个会做gpu的团队在能效这一个指标就铁定不会比amd差么

TOP

引用:
原帖由 卖哥 于 2020-2-16 14:16 发表

现在不是收个会做gpu的团队在能效这一个指标就铁定不会比amd差么
苹果在mac上还用amd

TOP

引用:
原帖由 yfl2 于 2020-2-16 14:24 发表

苹果在mac上还用amd
对苹果来说,易于控制优先级大于能效呗。
当然现在苹果有自己的gpu了,估计几年后一次性把英特尔和amd都换了

TOP

引用:
原帖由 卖哥 于 2020-2-16 14:37 发表

对苹果来说,易于控制优先级大于能效呗。
当然现在苹果有自己的gpu了,估计几年后一次性把英特尔和amd都换了
问你个问题,苹果能不经过intel的授权做x86架构的cpu嘛?
还是970那个时候,苹果收的后来踢掉的那个gpu公司的ceo记者问他为什么现在不出桌面显卡了,他回答专利壁垒太高了,已经没有办法绕过nv和amd的专利了。intel的gpu始终需要nv和amd的授权,苹果比你东家还要强嘛?更何况索尼?

TOP

posted by wap, platform: iPhone
引用:
原帖由 @yfl2  于 2020-2-16 14:24 发表
苹果在mac上还用amd
这事儿有媒体说过
苹果召回一批,时间太久老黄不肯买单,于是就闹翻了

TOP

引用:
原帖由 久多良木健 于 2020-2-16 15:19 发表
posted by wap, platform: iPhone
这事儿有媒体说过
苹果召回一批,时间太久老黄不肯买单,于是就闹翻了
我的意思是,卖个说是个组就能比amd强,结果苹果自己有gpu,在桌面端还是用amd

TOP

引用:
原帖由 u571 于 2020-2-16 13:05 发表



CPU现在跑深度学习绝大多数模型都远差于GPU,要不然老黄Q4服务器市场怎么会卖的这么好?牙膏厂为什么还要重新做GPU?

另外固定功能单元对于GPU晶体管面积占用并不高,例如RT core只占SM面积7%,看GPU电子显 ...
INTEL重新开启显卡板块为的还是更好的整合数据中心业务,搭建全家桶呗

你想啊,自己的处理器,自己的芯片组,自己的DCPMM,自己的SSD,自己的FPGA,自己的万兆网卡,就差数据中心Xe GPU这块拼图就完整了

消费级显卡这块只是拿前者的边角料技术去应付一下市场罢了,这块有N&A盘踞多年竞争已经够激烈了,而且薄利多销价格战也从来不是牙膏厂的风格。

[ 本帖最后由 Zico2003 于 2020-2-16 17:29 编辑 ]

TOP

posted by wap, platform: Samsung
引用:
原帖由 @achen126  于 2020-2-14 15:55 发表
老子就想卖贵点怎么了?智能手机卖那么贵你们2年一换的不是挺香吗?499刀爱买不买!!穷鬼别tm玩游戏了,搞烦了老子不做游戏机喽
游戏在欧美本来就是相对廉价的娱乐产品吧……

TOP

发新话题
     
官方公众号及微博