Board logo

标题: [数码手机] 给使用Nvida显卡的同志们推荐一个视频转码工具——MediaCoder [打印本页]

作者: aweiwei    时间: 2009-8-7 10:12     标题: 给使用Nvida显卡的同志们推荐一个视频转码工具——MediaCoder

支持多核,支持CUDA。尤其是这NB的CUDA,比单纯使用多核要快接近1倍以上。

单位的电脑配置是:E7400+9600GSO。

如果单纯用CPU双核,一部700M、60分钟的片子转成1200Kbs、H264编码(base,level3)、分辨率在480P左右(其实这个和转换速度关系不大,码率的关系才是最大的),时间大概需要30分钟多一点(而相同设置的快乐影音需要25分钟左右)。

可是一旦打开了CUDA,相同设置,所花的时间大概是11分钟多,其中还有1分多钟是在从temp文件夹复制到目标文件夹。编码速度大概在170FPS左右。

相信如果使用了四核+260显卡,速度还能再快不少。

这也是该软件号称的,使用I7+295显卡,转换一部蓝光电影到720P,只需要7分多钟。
作者: csisj    时间: 2009-8-7 10:21

[posted by wap]

可惜不支持ass字幕
作者: rb    时间: 2009-8-7 10:23

自打有了艾诺神机,转换软件就没用了 :D
作者: hj79310    时间: 2009-8-7 10:29

同楼上。什么时候出来RMVB支持的和山寨MP4一样好的手机就好了!
作者: aweiwei    时间: 2009-8-7 10:30

不一定非要用ASS或者SSA字幕吧,大部分不是都有SRT字幕么?

这里面也有现成的PSP、IPHONE的模式,速度嗖嗖的。
作者: henryzyl    时间: 2009-8-7 10:30

不会设置
作者: milklion    时间: 2009-8-7 10:33

[posted by wap, platform: UCWEB/IE/内置]

9300m能用吗
作者: henryzyl    时间: 2009-8-7 10:37

9300也支持粗大的。
作者: KONAMIX    时间: 2009-8-7 10:38

不错啊,下一个试试。
作者: aweiwei    时间: 2009-8-7 10:41

关键一点很不爽的,这东西必须配合FireFox使用……
作者: jojo10    时间: 2009-8-7 10:42

psp ip进口货专用啊
作者: KONAMIX    时间: 2009-8-7 10:43

这样的话,“复制”片子进psp看就很快了。。。。
作者: eva3d    时间: 2009-8-7 10:46

Badaboom....
作者: KONAMIX    时间: 2009-8-7 10:46

引用:
原帖由 aweiwei 于 2009-8-7 10:41 发表
关键一点很不爽的,这东西必须配合FireFox使用……
233,这……看来我还是再等等吧。
作者: aweiwei    时间: 2009-8-7 10:47

记得PCPOP上评测,一集柯南,转成PSP专用的,不到2分钟。
作者: lastescaper    时间: 2009-8-7 10:54

CUDA是个很NB的技术,转码硬解只是刚开始,以后的发展空间很大,硬威大的野心不小。

希望很快能看到N牌的CPU。
作者: aweiwei    时间: 2009-8-7 10:55

本次测试在笔者自用电脑上进行,平时除了工作游戏外也经常转视频,家用机为i7 920超频4GHz,工作机为E8400保持默认3GHz,显卡随时更换以测试CUDA转码时的差异。
测试系统配置:

PCPOP.Com泡泡网DIY评测室

硬件系统配置

处理器

Core i7 920 2.66GHzOC 4GHz

Core 2 Duo E8400 3.0GHz

主板

华硕 P6T DeluxeX58

华硕Rampage ExtremeX48

硬盘

日立1TB HDE721010SLA330

内存

金泰克DDR3-1333 2GBx3

显卡

影驰GTX285     

影驰9600GT刀锋版

微星9800GT绿色版

昂达9500GT      

电源

海盗船HX1000W

显示器

Sony 40V380A

软件系统配置

操作系统

Windows 7 Beta 7127 64bit

驱动

Forceware 186.18WHQL

    4核8线程的Core i7超至4GHz后,可以说是当前压片的神器了,相信网络上很多Remux和MKV的片子都是由Core 2 Quad或Core i7压制所得。那么有了GPU CUDA技术助阵后,压片速度能否更快呢?
    目前CUDA还不支持SLI及多GPU技术,因此显卡选择了单核最强的GTX285,另外还加入了中低端最热门的9800GT、9600GT和9500GT做对比,看看不同规格的GPU对性能转码性能影响有多大。
测试软件设置:

    Badaboom为最新的1.2.0.85中文特别版,转换时设置为内置的iPhone方案,输出码率为默认的1500kbps,实际视频码率是1436kbps。

    MediaCoder为目前最新的0.7.1.4450版,并打上X64补丁。为了与Badaboom公平对比,输出视频码率手动设定为1436kbps。编码器选择CUDA Encoder表示开启CUDA编码,选中“编码器画面处理”可以让GPU取代CPU进行滤波处理,进一步提升转码速度。

    将编码器换为X264就能禁用GPU编码,完全使用普通的CPU编码,这样就能直接对比CUDA编码器与X264编码器的转换效率,看看性能提升幅度到底有多大。

    一切准备就绪,PK正式开始。

    笔者平时最常做的视频转码应用,就是把各类DVD级或者720p级影片转成iPhone能放的分辨率,所以今天的测试就从720p转270p开始,测试影片为2009年7月即将上映的灾难巨片《2012》的预告片,标准的H.264编码Mov格式,Badaboom可以很好的支持它,至于MediaCoder则完全不用担心兼容问题。

    笔者平时都是吧i7 920从默认的2.66GHz超至4GHz使用,所以本次测试就分为超频和不超频两种模式,顺便可以看看CPU超频与否对转码速度有无影响。
第一回合:转码速度对比
    以下实测截图从左到右依次为:MediaCoder CUDA、MediaCoder X264、Badaboom CUDA,可点击放大,没兴趣就别点了,只看后面的柱状图即可。


i7 920 @ 2.66GHz时的结果


i7 920 @ 4GHz时的结果

    测试结果一目了然,三种编码方案中,Badaboom的速度是最慢的,即便是单核最强的GTX285,其速度也跟i7 920差很多,i7 920超频之后的性能更是达到Badaboom的两倍以上!
    但在MediaCoder里面开启CUDA加速后,编码速度更上一层楼,性能提升达60%,看来只有CPU和GPU强强联手才能达到顶级性能,任何一方特立独行都不会有太好的表现。
    i7超频后,Badaboom的速度没有任何变化,这就证明了Badaboom是主要依靠GPU编码的软件,并不依赖于CPU的性能。而MediaCoder不论CPU编码还是GPU编码,性能都同比提升了45%左右,看来MediaCoder依然是主要依靠CPU进行编码,GPU作为辅助,接管了最复杂的一部分算法,从而一定程度上消除了瓶颈,大幅提升性能。
    在超频状态,MediaCoder开启CUDA后的速度是Badaboom的3.5倍!


第四回合:不同平台对比,CPU和GPU对转码速度的影响

    在视频转码过程中,CPU负载多少、是不是瓶颈,只要看看CPU占用率就清楚了,但GPU的负载无从得知(A卡支持监控GPU占用率,而N卡不支持)。所以我们只能通过更换不同型号的显卡,来对比CUDA编码时的性能差异。
Badaboom转码时不同GPU、GPU对性能的影响

    本以为主要依靠GPU转码的Badaboom应该对显卡的要求很高,但测试结果却让人大跌眼镜!Badaboom既不能很好的支持高端多核CPU,也不能充分发挥高端GPU强大的运算性能,96GT以上级别显卡的性能几乎一模一样。
    问题主要出在片源的选择上面,通过之前的测试来看,片源分辨率越高转换效率就越低,如果改用480p的DVD的话,9800GT相比9600GT就会有20%左右的性能提升。
MediaCoder CUDA转码时不同GPU、GPU对性能的影响

    看得出来,MediaCoder过分依赖于CPU的性能,GPU只是配角,而且对显卡的要求比Badaboom更低,95GT与96GT/98GT的区别都不是很大。但有了GPU的支持性能提升还是很明显的。
    如果比绝对性能的话,MediaCoder凭借对四核的良好支持速度优势十分明显;但比相对性能的话,在E8400双核平台上,Badaboom能充分发挥96GT的性能,比起MediaCoder还是有微弱的优势;如果使用更低端的配置,那么Badaboom的优势相信会更加明显。
测试小结:
    综合来看,Badaboom CUDA和MediaCoder CUDA在转码时都存在瓶颈,Badaboom最大限度的削弱了CPU的作用,但也未能完全利用高端GPU的能量,因此在高端配置上很吃亏;而MediaCoder将CPU的资源发挥到了最大,但对于GPU的挖掘还不够深入。
    当然,最大的瓶颈可能还在于测试方法,给手持设备压制低分辨率低码率的视频时,输入运算量较大但输出数据量很少,视频编码过程的负载不均衡,导致CPU与GPU之间的协同运算出现互相等待的情况,就类似于流水线作业部分超负荷而部分空闲。

    那么在压制高清视频时,效率会不会更高一些呢?



第四回合:1080p压720p高负荷全长影片对比

    前面的测试都是小打小闹,主要针对手持设备,将普通或者高清影片压制成为分辨率和码率都较低的小视频文件,为了节约测试时间,片源也选择了时间较短的预告片,本身用不了太久,因此CUDA编码器的威力未能完全释放出来。

    现在我们就来正规一点的测试,将一部完整的1080p TS封装大片压制成为720p MKV封装,网络上最流行的720p高清影片就是通过蓝光光碟转码压制而成的。720p属于性价比最高的高清视频,一般都能刻录保存在DVD光盘里面,而画质却要比普通DVD影碟高很多,相信很多爱好高清的朋友都有下载、压制、收藏720p的习惯。

《007之大破量子危机》1080p转720p

    测试影片选择了《007之大破量子危机》,片源大小26GB,片长106分钟,1080p H.264编码,TS封装。目标格式:720p X264编码,MKV封装,最终容量3GB,复制音轨,详细设置如下:


CPU软解时:X264编码器设置


GPU硬解时:CUDA编码器设置

i7 920 oc 4GHz CPU独立编码:耗时46分钟

i7 920(4GHz) + 9600GT合作编码:耗时32分钟

i7 920(4GHz) + GTX285合作编码:耗时20分钟!


成绩图对比:Badaboom缺阵

    Badaboom可以支持TS封装的高清视频,也能压制成720p MP4封装,但这款软件显然不适合压制大容量的HDTV,笔者尝试用Badaboom对比MediaCoder时发现,Badaboom一开始转码速度还很正常,GTX285可达60fps左右的转换速度,预计不到一小时就能转换完毕,但几分钟后速度开始下降,越转越慢,居然仅有20fps左右,转完一整部HDTV耗时达2小时以上,这种性能表现明显是不正常的,因此笔者放弃了Badaboom测试。

    最终的结果让人欣喜若狂!i7 920和GTX285强强联手,将压片时间缩短了26分钟,性能提升幅度高达133%。换句话说,此时GTX285所贡献的性能要比超频到4GHz的i7还要多33%,CUDA编码器的威力可见一斑!而且此时GTX285的性能仍未被完全释放出来,看来只要MediaCoder继续优化CUDA编码器算法及转码机制,速度还有提升的空间!


第五回合:RMVB和AVI转码,Badaboom不支持

    Badaboom最大的软肋就是不支持网络上最流行的RMVB、AVI等格式的标清影片,而MediaCoder则能对所有格式提供无差别的支持,这一回合MediaCoder不战而胜,接下来就是MediaCoder自己的CUDA编码器与X264编码器在性能方面的较量了。

测试影片:名侦探柯南521 杀人犯工藤新一 1小时特别篇【RMVB】[848X480]


可点击放大看实测截图,没兴趣就别点了,只看柱状图即可

    一小时的动画片,不到3分钟就压制完毕,注意这还是在i7 920不超频的情况下,如果超频到4GHz的话,根据之前的测试数据来看性能又会提升45%左右,估计不到2分钟就能完成!

    从这一测试结果来看,GTX285的加速效果跟96GT基本没啥区别,看来在压制低码率的影片时,GPU性能处于过剩状态,没必要使用太好的显卡,瓶颈还是在CPU上面。

测试影片:魔兽世界燃烧的远征预告片,1024X436,片长2分47秒


从左到右依次为:GTX285、96GT、i7

    测试结果与前面的RMVB差不多,GTX285与96GT的加速效果依然基本没区别,但CUDA所带来的性能提升幅度更大,几乎达到了纯CPU软解的两倍以上!


    ● Badaboom抛砖引玉,MediaCoder修成正果:

    Badaboom显然只是一个玩具软件,在高端配置上它的性能表现令人非常失望,压制高清视频时也有BUG,也就只能在中低端配置上给手持设备压制低码率视频,但由于不支持RMVB不支持压字幕因此不适合中国国情。

    既便如此,我们还是要对Badaboom致以崇高的敬意,这款软件开创了GPU视频编码的先河,可以说为NVIDIA推广CUDA起到了抛砖引玉的作用,此后各类视频编辑、编码、后处理软件如雨后春笋般上市,Badaboom功不可没!

    此前我们已经对几款知名的CUDA视频软件做了测试,如Cyberlink MediaShowvReveal MotionDSPArcSoft TotalMedia Theatre等,但没有一款软件能够像MediaCoder这样带来激动人心的感觉,要么性能提升有限,要么效果不是很明显。

    MediaCoder(CUDA编码器)带来的并不仅仅是数倍于纯CPU编码的性能提升,它还有通吃一切的完美兼容性(将任何编码的视频转换为H.264编码),完全自定义的输出分辨率、码率、音轨、字幕、封装格式设定等等,最关键的一点:它是一款全免费的国产开源软件!

同是CUDA加速,MediaCoder比Badaboom快的真正原因:

    Badaboom为了强调GPU的优势、淡化CPU的作用,解码、编码、分辨率转换等能使用GPU处理的全都使用GPU CUDA技术,因此Badaboom的GPU占用率高而CPU占用率低。由于使用了GPU解码器的关系,Badaboom仅能支持H.264、Mpeg2和VC-1三种视频源(CoreAVC CUDA解码器也是如此),而不支持RMVB、DIVX等网络常见的编码。




    而MediaCoder只有运算量最复杂的编码器使用了CUDA技术,解码器可以使用常见的任意一种,等CPU算完了再交给GPU进行编码,所以GPU的负载会低一些,但也因此而保证了最完美的兼容性,几乎通吃一切视频格式。在分辨率转换部分,MediaCoder也可以使用CUDA运算,速度会有不小的提升,只要勾选编码器画面处理就表示启用CUDA。

    偏重于CPU的MediaCoder只能利用GPU的一小部分资源,因此在低配置双核电脑上的性能不如Badaboom,高配置四核电脑才是其大展身手的地方,这也就是通常所说的高性能计算吧,此时Badaboom由于浪费了CPU资源导致优势全无。

    当然,两者性能上最大的区别还是源于CUDA编码器算法,以及视频处理流程的优化,当大量数据往返于CPU与GPU之间时,瓶颈就产生了。其实很多时候CPU与GPU的性能都是很富裕的,时间都浪费在了沟通与等待上面,只有让CPU和GPU分别做最适合他们的任务,分工明确负载合理时,才能让性能产生飞跃!

CPU+GPU强强联手,电脑性能再创新高:

    在民用领域,四核CPU最能发挥优势的应用,应该就是视频编码了。除了常见的烤机软件外,也只有压片才能让四核八线程的i7占用率接近100%。而CUDA一出世就将目标瞄准视频编码,定位的确十分精准。当然以现有计算机的架构来看,GPU取代CPU是不可能的,但有了GPU的辅助,系统整体性能会有质的提高。



只有CPU与GPU强强联手,才能让电脑性能腾飞起来

    MediaCoder在支持CUDA编码器之前,对多核与多线程CPU的支持已经趋于完美。如今首次加入CUDA编码器,虽然对GPU资源的利用率还不够高,但性能提升幅度已经非常明显,相信随着开发团队不断优化与完善,编码效率还能有很大的提升空间!

    最后,感谢MediaCoder软件的作者黄轶纯及其开发团队给我们带来一款如此优秀的视频转码软件,感谢他为笔者提供的CUDA编码器及技术支持。作为一款免费的CUDA软件,能够从众多同类商业软件中脱颖而出,着实难能可贵!希望能有更多的朋友关注并支持MediaCoder的发展。




作者: zmqzmqzmq    时间: 2009-8-7 10:59

比较关注压制效果以及今后是否能加载到AVS内加速。。。。
作者: arex    时间: 2009-8-7 11:03

自从有了山寨MP4,电脑里的转片软件都闲置了
作者: KIRITE    时间: 2009-8-7 11:06

我用mediacoder调用了cuda进行压制,但是提示显卡驱动不对,但是这个显卡驱动明明是可以打开coreavc的cuda解码,这是怎么回事?
作者: shangchi    时间: 2009-8-7 11:18

我早就说这是个好软件……:D 另外没有firefox也可以用的,只是少数选项不能用了而已。
顺便发个以前的转PSP格式MP4的配置文件,不知道还能不能用在现在的版本上(因为用的A卡所以一直没升级)

RMVB >> 拖放 >> MP4,很多人要的MediaCoder配置文件for PSP
http://club.tgfc.com/viewthread.php?tid=6015924
作者: ages    时间: 2009-8-7 17:36

Mark一下
作者: 折翼大天屎    时间: 2009-8-7 18:58

[posted by wap, platform: Nokia]

需要注册吗
作者: 爱骑车的胖子    时间: 2009-8-7 18:59

前几天就在用了
爽了一天 结果说 CUDA证书过期

这几天才有了一个新的版本
作者: 爱骑车的胖子    时间: 2009-8-7 19:00

引用:
原帖由 折翼大天屎 于 2009-8-7 18:58 发表
[posted by wap, platform: Nokia]

需要注册吗
完全免费的
作者: henryzyl    时间: 2009-8-7 19:00

不需要注册
作者: 爱骑车的胖子    时间: 2009-8-7 19:02

引用:
原帖由 shangchi 于 2009-8-7 11:18 发表
我早就说这是个好软件……:D 另外没有firefox也可以用的,只是少数选项不能用了而已。
顺便发个以前的转PSP格式MP4的配置文件,不知道还能不能用在现在的版本上(因为用的A卡所以一直没升级)

RMVB >> 拖放 >> M ...
现在不用这个配置文件也行了

软件自带的有了

另外 貌似 CUDA压的片子 某些系统版本的PSP不能放 只能CPU硬算
作者: jinwei8108    时间: 2009-8-7 20:56

[posted by wap, platform: UCWEB/IE/内置]

最近用qq影音转换速度很快,我恨满意
作者: anubisx    时间: 2009-8-7 21:03

现在换升级了电脑,用MC转PSP MP4  一般都是在130-140FPS之间,够了
作者: Tiberium    时间: 2009-8-7 23:04

Win7下这个软件也很容易崩溃……在最后混合数据流的时候,不知道是我硬盘问题还是软件问题
作者: henryzyl    时间: 2009-8-8 11:33

下了最新的4488版,可以用粗大了。
作者: henryzyl    时间: 2009-8-8 11:43

请问PSP最高支持什么规格的H264视频啊?
作者: zmqzmqzmq    时间: 2009-8-8 11:48

[posted by wap, platform: UCWEB/IE/内置]

朋友找到挂载avs的办法了,支持滤镜和水印字体。。。。成熟了压片就更加方便鸟。。。。
psp支持main级别cabac+b帧的720+480的ar级别h264
作者: henryzyl    时间: 2009-8-8 12:02

这么设置对吗?main@level3?

[ 本帖最后由 henryzyl 于 2009-8-8 12:05 编辑 ]
作者: wuhanman    时间: 2009-8-8 18:31

[posted by wap, platform: iPhone]

关注一下。
作者: lijgame    时间: 2009-8-8 19:49

麻痹,ati的啥时候能出来个能用的阿
作者: sceic    时间: 2009-8-9 08:29

速度上去非常多,让人开始怀疑画质如何,有对比吗?
作者: bsgb666    时间: 2009-8-9 09:06

软件支持AVS输入,ASS怎么会是问题?
软件不需要FF浏览器,IE也可
目前该软件的CUDA只是强在速度,压缩率上太差,要达到相同质量的画面,码率需X264的1.5倍左右,所以是单纯追求压缩速度的情况下才会用,真正压片发布的不该用这个
作者: bsgb666    时间: 2009-8-9 09:11

引用:
原帖由 zmqzmqzmq 于 2009-8-8 11:48 发表
[posted by wap, platform: UCWEB/IE/内置]
朋友找到挂载avs的办法了,支持滤镜和水印字体。。。。成熟了压片就更加方便鸟。。。。
psp支持main级别cabac+b帧的720+480的ar级别h264
额,你误解了,这软件本来就能输入AVS的(现在不支持AVS的应该绝种了),我是说我解决了MC压出来的MP4不能用PPA播放的问题
作者: 网上的final    时间: 2009-8-9 09:26

很久不压片了 ,压片太累了
作者: zmqzmqzmq    时间: 2009-8-9 09:29

[posted by wap, platform: UCWEB/IE/内置]

哦?三鹿也来啦?参数搞定没?
作者: bsgb666    时间: 2009-8-9 09:41

引用:
原帖由 zmqzmqzmq 于 2009-8-9 09:29 发表
[posted by wap, platform: UCWEB/IE/内置]
哦?三鹿也来啦?参数搞定没?
囧,本来就没参数问题(压根就没几个参数可调…)
只是让你确认下能否播放
作者: aweiwei    时间: 2009-8-9 09:46

引用:
原帖由 sceic 于 2009-8-9 08:29 发表 速度上去非常多,让人开始怀疑画质如何,有对比吗?
我详细的对比了一下,反正用M8是看不出来。
片源都是那些大面积肤色、动作频率很大的那种。
作者: miomibuya    时间: 2009-8-9 10:01

[posted by wap]

感觉的确比纯用4核压 同码率差些 我q82 96gt 开cuda压只能用尽2核 速度比单用4核快30~40fps




欢迎光临 TGFC Lifestyle (http://bbs.tgfcer.com/) Powered by Discuz! 6.0.0