硬件系统配置 | |
Core i7 920 2.66GHz(OC 4GHz) Core 2 Duo E8400 3.0GHz | |
华硕 P6T Deluxe(X58) 华硕Rampage Extreme(X48) | |
日立1TB HDE721010SLA330 | |
金泰克DDR3-1333 2GBx3 | |
影驰GTX285 影驰9600GT刀锋版 微星9800GT绿色版 昂达9500GT | |
海盗船HX1000W | |
显示器 | Sony 40V380A |
软件系统配置 | |
Windows 7 Beta 7127 64bit | |
驱动 | Forceware 186.18WHQL |
将编码器换为X264就能禁用GPU编码,完全使用普通的CPU编码,这样就能直接对比CUDA编码器与X264编码器的转换效率,看看性能提升幅度到底有多大。
一切准备就绪,PK正式开始。那么在压制高清视频时,效率会不会更高一些呢?
前面的测试都是小打小闹,主要针对手持设备,将普通或者高清影片压制成为分辨率和码率都较低的小视频文件,为了节约测试时间,片源也选择了时间较短的预告片,本身用不了太久,因此CUDA编码器的威力未能完全释放出来。 现在我们就来正规一点的测试,将一部完整的1080p TS封装大片压制成为720p MKV封装,网络上最流行的720p高清影片就是通过蓝光光碟转码压制而成的。720p属于性价比最高的高清视频,一般都能刻录保存在DVD光盘里面,而画质却要比普通DVD影碟高很多,相信很多爱好高清的朋友都有下载、压制、收藏720p的习惯。 ● 《007之大破量子危机》1080p转720p 测试影片选择了《007之大破量子危机》,片源大小26GB,片长106分钟,1080p H.264编码,TS封装。目标格式:720p X264编码,MKV封装,最终容量3GB,复制音轨,详细设置如下: ● i7 920 oc 4GHz CPU独立编码:耗时46分钟 ● i7 920(4GHz) + 9600GT合作编码:耗时32分钟 ● i7 920(4GHz) + GTX285合作编码:耗时20分钟! ● 成绩图对比:Badaboom缺阵 Badaboom可以支持TS封装的高清视频,也能压制成720p MP4封装,但这款软件显然不适合压制大容量的HDTV,笔者尝试用Badaboom对比MediaCoder时发现,Badaboom一开始转码速度还很正常,GTX285可达60fps左右的转换速度,预计不到一小时就能转换完毕,但几分钟后速度开始下降,越转越慢,居然仅有20fps左右,转完一整部HDTV耗时达2小时以上,这种性能表现明显是不正常的,因此笔者放弃了Badaboom测试。 最终的结果让人欣喜若狂!i7 920和GTX285强强联手,将压片时间缩短了26分钟,性能提升幅度高达133%。换句话说,此时GTX285所贡献的性能要比超频到4GHz的i7还要多33%,CUDA编码器的威力可见一斑!而且此时GTX285的性能仍未被完全释放出来,看来只要MediaCoder继续优化CUDA编码器算法及转码机制,速度还有提升的空间! Badaboom最大的软肋就是不支持网络上最流行的RMVB、AVI等格式的标清影片,而MediaCoder则能对所有格式提供无差别的支持,这一回合MediaCoder不战而胜,接下来就是MediaCoder自己的CUDA编码器与X264编码器在性能方面的较量了。 ● 测试影片:名侦探柯南521 杀人犯工藤新一 1小时特别篇【RMVB】[848X480] 一小时的动画片,不到3分钟就压制完毕,注意这还是在i7 920不超频的情况下,如果超频到4GHz的话,根据之前的测试数据来看性能又会提升45%左右,估计不到2分钟就能完成! 从这一测试结果来看,GTX285的加速效果跟96GT基本没啥区别,看来在压制低码率的影片时,GPU性能处于过剩状态,没必要使用太好的显卡,瓶颈还是在CPU上面。 ● 测试影片:魔兽世界燃烧的远征预告片,1024X436,片长2分47秒 测试结果与前面的RMVB差不多,GTX285与96GT的加速效果依然基本没区别,但CUDA所带来的性能提升幅度更大,几乎达到了纯CPU软解的两倍以上! ● Badaboom抛砖引玉,MediaCoder修成正果: Badaboom显然只是一个玩具软件,在高端配置上它的性能表现令人非常失望,压制高清视频时也有BUG,也就只能在中低端配置上给手持设备压制低码率视频,但由于不支持RMVB不支持压字幕因此不适合中国国情。 既便如此,我们还是要对Badaboom致以崇高的敬意,这款软件开创了GPU视频编码的先河,可以说为NVIDIA推广CUDA起到了抛砖引玉的作用,此后各类视频编辑、编码、后处理软件如雨后春笋般上市,Badaboom功不可没! 此前我们已经对几款知名的CUDA视频软件做了测试,如Cyberlink MediaShow,vReveal MotionDSP,ArcSoft TotalMedia Theatre等,但没有一款软件能够像MediaCoder这样带来激动人心的感觉,要么性能提升有限,要么效果不是很明显。 MediaCoder(CUDA编码器)带来的并不仅仅是数倍于纯CPU编码的性能提升,它还有通吃一切的完美兼容性(将任何编码的视频转换为H.264编码),完全自定义的输出分辨率、码率、音轨、字幕、封装格式设定等等,最关键的一点:它是一款全免费的国产开源软件! ● 同是CUDA加速,MediaCoder比Badaboom快的真正原因: Badaboom为了强调GPU的优势、淡化CPU的作用,解码、编码、分辨率转换等能使用GPU处理的全都使用GPU CUDA技术,因此Badaboom的GPU占用率高而CPU占用率低。由于使用了GPU解码器的关系,Badaboom仅能支持H.264、Mpeg2和VC-1三种视频源(CoreAVC CUDA解码器也是如此),而不支持RMVB、DIVX等网络常见的编码。 而MediaCoder只有运算量最复杂的编码器使用了CUDA技术,解码器可以使用常见的任意一种,等CPU算完了再交给GPU进行编码,所以GPU的负载会低一些,但也因此而保证了最完美的兼容性,几乎通吃一切视频格式。在分辨率转换部分,MediaCoder也可以使用CUDA运算,速度会有不小的提升,只要勾选编码器画面处理就表示启用CUDA。 偏重于CPU的MediaCoder只能利用GPU的一小部分资源,因此在低配置双核电脑上的性能不如Badaboom,高配置四核电脑才是其大展身手的地方,这也就是通常所说的高性能计算吧,此时Badaboom由于浪费了CPU资源导致优势全无。 当然,两者性能上最大的区别还是源于CUDA编码器算法,以及视频处理流程的优化,当大量数据往返于CPU与GPU之间时,瓶颈就产生了。其实很多时候CPU与GPU的性能都是很富裕的,时间都浪费在了沟通与等待上面,只有让CPU和GPU分别做最适合他们的任务,分工明确负载合理时,才能让性能产生飞跃! 在民用领域,四核CPU最能发挥优势的应用,应该就是视频编码了。除了常见的烤机软件外,也只有压片才能让四核八线程的i7占用率接近100%。而CUDA一出世就将目标瞄准视频编码,定位的确十分精准。当然以现有计算机的架构来看,GPU取代CPU是不可能的,但有了GPU的辅助,系统整体性能会有质的提高。 MediaCoder在支持CUDA编码器之前,对多核与多线程CPU的支持已经趋于完美。如今首次加入CUDA编码器,虽然对GPU资源的利用率还不够高,但性能提升幅度已经非常明显,相信随着开发团队不断优化与完善,编码效率还能有很大的提升空间! 最后,感谢MediaCoder软件的作者黄轶纯及其开发团队给我们带来一款如此优秀的视频转码软件,感谢他为笔者提供的CUDA编码器及技术支持。作为一款免费的CUDA软件,能够从众多同类商业软件中脱颖而出,着实难能可贵!希望能有更多的朋友关注并支持MediaCoder的发展。
第四回合:1080p压720p高负荷全长影片对比
CPU软解时:X264编码器设置
第五回合:RMVB和AVI转码,Badaboom不支持
原帖由 shangchi 于 2009-8-7 11:18 发表
我早就说这是个好软件……:D 另外没有firefox也可以用的,只是少数选项不能用了而已。
顺便发个以前的转PSP格式MP4的配置文件,不知道还能不能用在现在的版本上(因为用的A卡所以一直没升级)
RMVB >> 拖放 >> M ...
原帖由 zmqzmqzmq 于 2009-8-8 11:48 发表
[posted by wap, platform: UCWEB/IE/内置]
朋友找到挂载avs的办法了,支持滤镜和水印字体。。。。成熟了压片就更加方便鸟。。。。
psp支持main级别cabac+b帧的720+480的ar级别h264
欢迎光临 TGFC Lifestyle (http://bbs.tgfcer.com/) | Powered by Discuz! 6.0.0 |