» 您尚未登录:请 登录 | 注册 | 标签 | 帮助 | 小黑屋 |


发新话题
打印

[新闻] PSV【Unit 13 】最新画面(11月23日)

引用:
原帖由 u571 于 2011-11-23 12:07 发表



543MP4浮点shader性能连RSX十分之一都没有,RSX的十分之一能做什么特效?
差距没这麽远吧
SGX543=9 F32 flops per pipe or 36 per core
SGX543MP4=36*4*200MHz=28.8gflops
大部份PS3游戏都是以720P或以上render
PSV在960*544之下应能有PS3的三成表现

[ 本帖最后由 JimmyC 于 2011-11-23 13:39 编辑 ]


TOP

引用:
原帖由 hourousha 于 2011-11-23 13:50 发表

USSE2什么时候有9 FP32 Flops per pipe了?
你要说它可以Vec4 + Scalar并发那没问题,但是Scalar是FP32,Vec4可是FX10 x4而不是FP32 x4的哦。
所以,在Vec4做FMADD的情况下,它也只是1 FP32 Flops+ 8 FX10 ops而 ...
http://forum.beyond3d.com/showpost.php?p=1557286&postcount=17
是我理解错误吗?
JohnH是PowerVR的架构工程师, 他是这样说的
FP16或INT8之下性能更高
引用:
Yes it is FP32 ops, as Arun indicated each pipeline is VEC4 F32 FMAD, in addition we can run a parallel (real) floatingpoint op giving 9 F32 flops per pipe or 36 per core.
引用:
543 has 4 USSE2 pipes, each capable of 4 FP32 MADDs and one additional FP32 operation which IMG has never really talked about (best case it's an extra ADD, worst case it only does stupid stuff like format conversions, I don't know). FP16 and INT8 performance is higher but not massively so.
相关讨论
http://forum.beyond3d.com/showthread.php?p=1557277

[ 本帖最后由 JimmyC 于 2011-11-23 18:53 编辑 ]



TOP

经查证过後

每个USSE shader可处理
最低1 FP32 scalar, 最高2 FP32 FMADD, 或
2 FP16 (Vec2), 或
2 INT16 (Vec2), 或
4 ES2.0 Lowp (Vec3 or 4), 或
4 INT8 (Vec3 or 4)

由於数据通路宽度限制
USSE全速2 FP32 FMADD只限两个有共通性的输入运算
vector-matrix multiplication或scalar-vector multiplication等
USSE2取消了这个限制
每个USSE2 shader可无限制处理4 FP32 FMADD + 1 FP32 operation
200MHz的SGX543MP4+有28.8GFLOPS(FP32)是正确的

没有资料来源, 你懂的
欢迎指正

[ 本帖最后由 JimmyC 于 2011-11-24 01:10 编辑 ]


TOP

发新话题
     
官方公众号及微博