» 您尚未登录:请 登录 | 注册 | 标签 | 帮助 | 小黑屋 |


 31 123
发新话题
打印

[其他] 进一步解析PS4的改变及未来!长文翻译!

转自TUBUS,感谢BUS翻译组,感谢!
原帖:http://bbs.tgbus.com/thread-4425231-1-1.html

这篇文章里面有一个亮点,就是Mark Cerny谈到了为什么PS4没有用eDRAM,而是用简单粗暴的8G DDR5内存!:D
译者:ark1800 感谢长篇技术文翻译
http://ps3.tgbus.com/zixun/redian/201304/20130428095323.shtml
【电玩巴士编译报道,转载请注明出处】PS4的首席设计师Mark Cerny在Gamasutr的访谈中,以开发者的视角深度解析了PS4。整个访谈将不涉及PS4的UI和OS部分,重点是PS4整个系统的能力,以及是什么样的思路让Cerny和他的团队选择了什么样的部件,这些部件又是怎么样协同工作  Cerny着手PS4的设计开始于2007年后期。“因为我们之前在分析PS3,人员来自SCE各个领域的一个大型团队在评估PS3的表现。”他们之后很自然地开始思考下一步应该怎么做,思考SCE的下一代主机应该是什么架构。Cerny花了感恩节假期去阅读X86架构的历史。他认识到X86架构不仅仅多年来实现了戏剧性的演进,在PS4发售之时,这个架构将足以满足索尼的需求。“它已经进化到让游戏行业中非常极端的程序员也能使用的程度。”出于对PS4项目的激情,感恩节后,Cerny找上了索尼的Phil Harrison和Masa Chatani,请求主导PS4开发。让Cerny非常惊喜的是,他们答应了。

PS4最重要的事情
  Cerny说明,PS4设计最重要的需求就是“硬件对于想要开发高质量游戏的程序员来说不能是一个麻烦的问题。”
  PS3性能强劲,但是特殊的CELL处理器难住了开发者。“尽管性能强大,但为了释放这些能力,你需要研究,学习怎么合理地使用硬件。”这种情况直接影响到了PS4的设计思路。PS4需要一个性能强大的架构,同时也要是一个各方面开发者都熟悉的架构。
  Cerny反复表达,“我们要确保硬件的易用性。于是我们使用了大家熟悉的CPU和GPU保证这一点。”在被问到索尼如何看待第三方为下一代XBOX开发游戏的时候,Cerny回答说“我说我们不想为开发者设置问题,这就意味着我们在跨平台领域也将有出色的表现。”
  易用性并不是唯一的目的。作为有31年从业经验的老将,Cerny知道即便在PS4走进坟墓之后,PC也将继续发展。“我们尝试在马上能使用的功能,以及保证系统能在数年内同游戏一起持续发展的功能中取得一个平衡。”强化版PC架构就是Cerny的团队使用的方案。这种架构将提供PC不能提供的重大优势,同时保证工程师们能有一个熟悉的技术环境。
  为了开发PS4,Cerny不仅仅是在做调查研究,或者分析PS3,他同样大量拜访了开发者团队,和中间件合作伙伴进行对话,以精确找到在下一代主机中开发者需要什么。
  强化意味着什么?
  乍眼看上去,PS4架构很面熟。SCE开发团队的工作极大拓展了它,其所能实现的远远超过它基本的能力。
  比如GPU。“这是一块Radeon GPU。看参数不能让我们清楚了解它的状况。我们使用了AMD最先进的技术,并做出了大量的修改。”要理解PS4,我们需要认识Cerny对其的预想(易用,长期保持性能领先),再结合团队的选择(在成熟的架构上进行修改)。这就是强化的意义。
  强化的部分,大部分来自于单个统一高速内存空间的使用。PS4有8GB GDDR5 RAM,CPU和GPU都能简单,完整地访问这个空间。PC的话,如果有8GB记忆体,CPU和GPU在现有框架上只能共享到1%的空间。这是PCIe速度造成的限制。PS4使用的统一架构带来了很实际的好处。这是开发者着手为这个系统编程就能感受到的好处。

CPU和GPU被整合在AMD的一块“非常巨大的单块自定义芯片”。8个Jaguar核心,GPU,以及大量其他单元都在一个die上。内存并不在芯片上,通过256位位宽的总线,核心和内存空间能以176GB/S的速度通信。
  Cerny表示,原本团队也可以将总线位宽缩水至128位,这样带宽就只有88GB/S,然后在芯片上集成eDRAM将性能提回去。一开始团队也考虑过这种更容易生产的做法。但由于这会增加开发者的复杂性,他们放弃了这种思路。不想为开发者社区造成麻烦,这就是坚持统一内存的原因。  Cerny表示,在拜访各个工作室询问对PS4的要求,最多的反馈就是要求统一内存。为了保证架构对开发者友好,他们放弃了内置TB/s级别带宽的RAM,这充分说明了他们对开发整体的思考。
  这种设计方法能给游戏机带来什么样的好处呢?Cerny的想法是:长寿。
  Cerny确信在接下来的几年中开发者使用GPU将不局限于提升画面,同时他相信自己采取了一个更具弹性和性能的解决方案。“GPU将同等地用于图像和通用计算,我们相信在PS4生命的中期,异步计算将成为游戏开发技术的重要组成部分。”
  届时将有众多程序同时运行在GPU上,同时进行物理运算,碰撞计算,和光线追踪。
  这种预期带来了一个重大的挑战。“如果我们预计异步运算这种技术将在PS4生命的中期大量运用,问题就是,我们怎么在设计硬件的时候就支持它。”传统的PC硬件环境是一个阻碍。CPU ,GPU和内存的通信是个问题。而PS4的架构设计就处理了这个问题。传统的PC GPU有两个总线。一个是GPU访问显存的,第二个是通过PCIe访问系统内存。无论使用哪个总线的时候,GPU的内部缓存都将成为CPU和GPU通信的障碍,当GPU要读取CPU写好的数据,或者当GPU要写入CPU能用的数据,GPU内部缓存的重写要耗费大量的时间。
  为了实现预想,索尼如何修改硬件
  索尼做出了3大修改。
  1.首先,SCE增添了一个总线,让GPU能绕过专属的L1L2缓存,直接读写系统内存。如果CPU和GPU之间传递的数据够小,开发者就不需要考虑将他们同步。 开发者可以用20GB/S的总线带宽传递它,这个数字大于大多数当前PC上的PCIe。
  2.其次,假设开发者想用GPU L2缓存同时进行图像和异步计算,SCE为缓存增加了一个标记用的位,这称之为volatile位。开发者可以有选择地标记计算使用的访问空间。当计算访问系统内存的时候,这些使用了的L2空间将不可用;当结果写回的时候,这些已经使用了的L2空间将可以写。这个创新解决了计算使用GPU L2时的请求操作对同时进行的图形操作造成冲击的问题。换句话说,就是减少了在GPU上同时进行图像处理和通用计算的开销。
  3.第三,原生的AMD GCN架构支持一个图像指令源和两个计算指令源。在PS4中,SCE将这个限制增加到了64个计算指令源。如果你想进行一些异步运算,你可以将指令放进64个指令的队列中,然后硬件的多级仲裁将决定哪个指令何时,如何运行。整个过程独立于系统的图像处理。

安排这么多计算工作资源并不只是因为游戏系统需要,中间件也需要计算。而中间件的计算工作请求将会和游戏的请求混合起来,最后同图像的请求一并,在整个运算流程中即时得到优化安排。
  这个理念源自索尼开发的,名为SPURS的软件。这个软件用来帮助程序员安排CELL里SPU的任务。在PS4里它会被集成在硬件中。
  Cerny称考虑设计这些功能的时间点是在2009,2010年,但是人们完整利用他们的时间点可能是在2015年。
  在混合计算和图像的处理上,SCE加上了大量的控制手段。让开发者们可以在进行大量异步运算的时候,能明确他们到底想使用哪一个。Cerny希望开发者在GPU上运行诸如物理运算之类的中间件。通过上述的系统,开发者能让两者都得到非常高效的运行。
  Cerny说明,“如果你着眼于当前GPU可以用来进行通用计算的部分,他会随时发生变化。比如opaque shadow map渲染就没有用到pixel shader,它完全是vertex shaders和光栅化硬件完成的。这样图像方面就用不上1.8T的浮点运算能力。
  首发和将来
  这些好处将在PS4的首发游戏中就得到体现。Cerny表示,在将来,这些优点将会通过更多的方式表现出来。PS4的首发阵容将比以往的PS硬件更强。这是因为开发者熟悉架构。但是到了2015年,PS4真正需要的就是那些定制的工作。因为竞争对手也将进行那些工作。
  届时,在开发者掌握PS4之后,他们可以在数周,而不是数月内将游戏引擎从PC导入PS4,并修改他们使用的技术,切切实实地获得益处。
  有许多的方法控制GPU资源在图像和计算之间的分配。一开始,正如大多数首发游戏那样,全部资源都会分配给图像。到了PS4生命的中期,将会有更多资源转向计算方面。
PS4的专用单元
  PS4开发团队通过将基础功能交给专有单元的方法,使PS4更有灵活性。开发者不需要去分配游戏运行的资源去解决那些需求。使用专用单元的原因是,游戏需要考虑的这方面开销将会非常少。这为开发者建立用户体验设置了一个基线。
  比如,通过系统的专用音频单元,开发者可以在不占用游戏资源的情况下支持语音聊天。同样的还有视频解码编码。音频单元同时还负责了游戏中大量MP3数据流的解码工作。
  在纽约的发布会上,Cerny提到了PlayGo这个让PS4在游戏时也能下载数字内容的系统。其设计理念就是,玩家只需要下载部分数据就可以开始游戏。剩下的数据将在游戏的时候后台下载。
  PlayGo是两个独立的,相互连接的系统。它的另外一部分是解决蓝光光驱相对于次世代游戏已经偏慢的问题。原理就是先访问蓝光碟上游戏数据,将其放在硬盘上。在空闲的时候,后台也在继续向硬盘中拷贝数据,在一两个小时之后,游戏实际上已经在硬盘里。玩家的读取将会变快。这个系统还加入了一个支持zlib解码的单元,开发者可以安心地压缩所有游戏数据,系统将即时解压这些数据。至少,游戏的媒体文件是zlib压缩的。

还有另外一款自定义芯片让系统可以在低功耗状态下进行后台下载。玩家可以关闭主机电源,PS4只有第二芯片,系统内存和I/O,硬盘和网络部分供电,从而实现超低功耗后台下载。此外,PS4还可以将除内存外的其他部分完全断电,这样只要一开机就能接着之前的进度继续游戏。
  瓶颈是?
  Cerny 对于可能遇到的瓶颈也没有掩饰。他相信自己的团队已经有效的处理了这个问题。“图像方面,第一个可能遇上的瓶颈就是内存带宽。下一代游戏中,一个物体有十多个纹理将是标准。很快系统就会到达瓶颈,一小部分的渲染过程就会达到记忆体界限,除了转为使用lower bit-per-texel textures,没有其他很好的办法。对此我们的策略很简单,就是用GDDR5作为系统内存,提供大量的带宽。
  如果记忆体不是瓶颈,如果游戏中的物件有细致的网格,就很可能在顶点数量上遇到瓶颈。开发者可以让艺术家让三角形更粗大,但是这很难掌控。这种情况在屏幕大量显示的三角形都只有一个像素大的时候,很容易就出现了。
  我们有大量不同的技术去减少顶点数量瓶颈。有的是硬件的增强,最有趣的的还是让compute作为图像的前端。
  这项技术混合了硬件,GPU里的固件和编译器技术。当开发者使用vertex shader的时候,将会编译两次,一次以compute shader的形式,一次以vertex shader的形式。这样可以即时的减少顶点数量。在硬件内部,两个shader是非常紧密结合在一次的。
  Cerny还保证,索尼正在开发一个为PS4优化的性能分析工具Razor。

开发的窍门
  Cerny了解开发者对硬件需求还有一个窍门。“当我2007年末开始负责架构设计的时候,我知道我将主要去负责硬件,偶尔继续做一点软件方面的工作。接下来一段时间我专注于硬件的工作。”但这种软硬分离的状况没有持续很长时间。SCE多年的负责人Akira Sato强烈Cerny建议不要放弃软件方面。“不要放弃软件,要是你在开发一款游戏,无论你是做硬件设计,开发者环境,或者工具链,你对整个进程的价值都要高出许多。”这就是Cerny的PS4游戏《Knack》诞生的经过。这就是Cerny了解开发者实际问题的独特方式。
-----------------------------------------------------------------------------------------------------:D


TOP

游戏才是根本,我总不能对着8G内存操吧?



TOP

posted by wap, platform: Samsung (Focus)

浏览一遍,感觉xbox3亚历山大


TOP

好长~~
期待PS4的表现,向幕后设计师表示一下敬意~~

[ 本帖最后由 正义的化身 于 2013-4-28 17:15 编辑 ]

TOP

感觉PS4更专注于GAME,XBOX8更专注于平台,和本时代相比刚好反了过来。

TOP

达芬奇

TOP

posted by wap, platform: ZTE

能秒1230+670就成...

TOP

为什么没有请精通架构和游戏以及特效的国家级程序员天师来指导设计呢?

TOP

有很多地方翻译的不到位

TOP

坐等光荣哥开喷

TOP

posted by wap, platform: Android

不信微软搞dx开发的不如索尼了解?

TOP

对比了一下,有几个地方翻译错误了。
1.首发和将来
  这些好处将在PS4的首发游戏中就得到体现。Cerny表示,在将来,这些优点将会通过更多的方式表现出来。PS4的首发阵容将比以往的PS硬件更强。这是因为开发者熟悉架构。但是到了2015年,PS4真正需要的就是那些定制的工作。因为竞争对手也将进行那些工作。
2.比如GPU。“这是一块Radeon GPU。看参数不能让我们清楚了解它的状况。我们使用了AMD最先进的技术,并做出了大量的修改。”要理解PS4,我们需要认识Cerny对其的预想(易用,长期保持性能领先),再结合团队的选择(在成熟的架构上进行修改)。这就是强化的意义。

可惜了

TOP

虽然已经做的很好了,但它们没有想到四两拨千斤的隐藏作用,这对PS4是致命的

TOP

我们巨硬有四两拨千斤,不怕不怕

TOP

posted by wap, platform: iPhone
引用:
原帖由 @tommyshy  于 2013-4-28 16:49 发表
posted by wap, platform: Samsung (Focus)

浏览一遍,感觉xbox3亚历山大
相信微软和英特尔、AMD规划的系统级SOC内嵌ESRAM的次世代新标准会赢得胜利

TOP

 31 123
发新话题
     
官方公众号及微博