魔头
原帖由 FXCarl 于 2007-10-21 19:14 发表 NND……回了这贴后,貌似这贴又被我毁了?
查看详细资料
TOP
原帖由 FXCarl 于 2007-10-21 21:24 发表 顺便带一句,有人对 GT 这次的真正有意思的地方之一,车身的 BRDF 有兴趣么?
原帖由 FXCarl 于 2007-10-21 22:33 发表 实际上,作为一个GTFans,但是同时也作为一个游戏开发人员,会知道。有时候凭爱是解决不了问题的~ 譬如说一个经典的问题,单车 20W 面,16台车同屏。一个多么华丽的数字,但是稍微计算就会出问题 200,000 * 16 ...
原帖由 FXCarl 于 2007-10-21 23:33 发表 LS 谢谢,我正好有一项工作内容就是写 Shader ……实践经验表明在游戏里真正实用的渲染算法至少在工具评估结果上再留 20% 的闲置出去。以防止峰值情况。 GPU 从来都是比预想的更慢,一般来说因为缓冲命中等问题性 ...
原帖由 FXCarl 于 2007-10-22 12:47 发表 这样讨论才有意思 1.MSAA的算法的确可能是暴力的,但是貌似NV的人说不是暴力的。 MSAA的方式是从周围像素取色彩混合(CSAA还会做加权)在一个多边形内部,光栅化没有疑义的时候,就没有做AA必要,否则会模糊画面。 2. 这个问题很微妙了,MSAA和HDR本身不会存在冲突,这个从理论上来说就是成立的。因为HDR不过是个概念,时髦的实现是用RGBE格式ToneMapping得到最终结果。这个地方我承认我前面就说错了…… 3.加速度图……这个东西我说的很模糊,实际上有些地方不翻书想不起来,按照大致原理随便说的,开销是差不多的。具体的模样可以查看KillZone2的PPT,算法Capcom的DX10 LP 的相关PPT里似乎说过。 4.想让计算有意义其实不难,但是数字会更恐怖的。DepthPass可以用MRT,不需要额外顶点计算。Shadow算法貌似是ShadowMap,要把所有多边形都要变换到灯的视空间去,翻一倍开销。 最后计算一下优化问题,目前的裁剪算法都是针对场景,对车辆这种东西都没有什么用……而且前提还是裁剪是在CPU做。别说用GPU的遮挡查询,要是那样,不还是要GPU把顶点操作一遍? 所以我也提到了,优化的话,貌似也只有LOD一条路,稍微远点就把车内全部删除掉。可要是这样说的话,全车全20W面不也是空话了么。 在数学里,推翻一个定理的做法只需要一个反例。我只要可以提出一种情况超过了RSX的处理能力,是不是应该就可以证明不可能有 20W面16车 同屏了呢? 16BitNormalMap的用处请查阅ATi的Carpaint技术文献,法线图只是法线扰动。不仅可以制造细节,也可以平滑表面,不同用法而已。因为车辆表面可能是高次曲面,直接用法线线性平滑产生的表面是肯定体积走样的,需要用法线图来纠正。如果用一般每轴 8bit 整数的法线,还外加压缩,最小法线偏角接近1度……是不能满足高光滑度表面的需要的……我没有做过亲身实验(等用空补上),但是我觉得ATi的说法是有道理的。
原帖由 FXCarl 于 2007-10-22 19:35 发表 [url=http://www.tgfcer.com/club/redirect.php?goto=findpost&pid=3170165&ptid=5916591][img]回 hourousha ~ 我不是研究硬件的,不太清楚所谓禁用 ColorWrite …… 貌似按照DX9的传统渲染流程里,是没有办法先计算顶点深度然后跳过显卡的光栅化就可以取出数据的。此外就是从显卡取回数据也还是要浪费额外的时间(特别PS3的RSX和Cell还不共用存储器) DX10则要走GS。反正一套顶点变换是少不了。一般来说为了减少顶点操作负担,优化还是在批的组织上~而这个工作,GPU也帮不上太大忙,因为GPU根本不“懂得”你的场景结构 回PHT UE3引擎的游戏,Shader大都是公开的未编译版本(UT3,Vegas都是),RGBE的编码和解码函数清晰可见。当然,我也可以说这是为了以后留有余量…… 还有补充一下,大大不小心说了一句话不够严谨……法线贴图再哪个空间其实没有关系,关键是的,它偏移了纹素所覆盖面积中的表面法线方向。在切空间意味着是沿着切线和副法线的坐标系偏移,而在物体空间,是按照物体的上下左右偏移罢了。