Board logo

标题: [电脑] 用G80或以上级别N卡的用户有福了!!!初步测试用GPU充当CPU的工作!!! [打印本页]

作者: 超越梦想    时间: 2008-6-2 13:49     标题: 用G80或以上级别N卡的用户有福了!!!初步测试用GPU充当CPU的工作!!!

转自PCI

【Update,可以得到正确core数目】写了个CUDA程序,测试GPU性能,请发出你的结果

【updata】:需要看core数目的朋友们可以下载更新的版本,不需要你更新显卡驱动就可以得到multiprocessors和cores的正确值。

对测试结果没有影响。



要CUDA在本机能够运行,需要有以下条件:
1,有G80以上级别的显卡,这里有详细列表:http://www.nvidia.com/object/cuda_learn_products.html
2,请装最新驱动,检查你的驱动是否支持CUDA的方法是,在你的Windows/system32目录中检查是否有这两个文件:nvcuda.dll,nvapi.dll
nv推荐驱动如下,和普通驱动的区别是里面包含了cuda的支持。
xp:           http://www.nvidia.com/object/thankyou.html?url=/compute/cuda/2.0-Beta/NVIDIADisplayWin2K(174_55)Int0414.exe
xp-64:        http://www.nvidia.com/object/thankyou.html?url=/compute/cuda/2.0-Beta/NVIDIADisplayWin2KAMD64(174_55)Int0414.exe
vista:         http://www.nvidia.com/object/thankyou.html?url=/compute/cuda/2.0-Beta/NVIDIADisplayWinVista(174_55)Int0414.exe
vista-64:    http://www.nvidia.com/object/thankyou.html?url=/compute/cuda/2.0-Beta/NVIDIADisplayWinVista64(174_55)Int0414.exe

3,有CUDA的运行库,我已经提取出来,放在压缩包里了。

这个小程序只是测试一下你的GPU计算一些通用算法所需要的时间,在最后会打出总的消耗时间。

下面是我的FX570M显卡的结果52s,欢迎大家也贴出自己的。

注意,水平有限,对SLI不支持,只能有一个显卡在计算。

CUDA的计算过程没有对CPU的调用,至于CPU占有率的问题,是CPU在处理和显卡之间的数据同步,CPU陷入了对OS内核中断的处理,而不是说CPU本身在参与CUDA的计算,对此怀疑的同志们可以放心了,呵呵。

可以看callstack结果:

ntkrnlpa.exe!KiUnexpectedInterrupt+0x121
ntkrnlpa.exe!ZwYieldExecution+0x1c8e
hal.dll+0x2ef2
hal.dll!HalMakeBeep+0x413
ntkrnlpa.exe!KeReleaseInStackQueuedSpinLockFromDpcLevel+0xb74
ntdll.dll!KiFastSystemCallRet
nvcuda.dll+0xc79ff
nvcuda.dll!cuTexRefGetFlags+0x44c8
nvcuda.dll!cuLaunchGridAsync+0x8e
cudart.dll+0x13174
cudart.dll+0x12396
cudart.dll!cudaLaunch+0x53
miniGPUTest.exe+0x1860



新版测试程序下载地址:xp版本:http://www.mediafire.com/?mbogfnqu95z

                                   vista 版本 : http://www.mediafire.com/?mmwbtnrgwch

--------------------------------------------------------------
There is 1 device supporting CUDA

Device 0: "Quadro FX 570M"
  Major revision number:                         1
  Minor revision number:                         1
  Total amount of global memory:             268107776 bytes
  Number of multiprocessors:               4
  Number of cores:                                 32
  Total amount of constant memory:               65536 bytes
  Total amount of shared memory per block:       16384 bytes
  Total number of registers available per block: 8192
  Warp size:                                     32
  Maximum number of threads per block:           512
  Maximum sizes of each dimension of a block:    512 x 512 x 64
  Maximum sizes of each dimension of a grid:     65535 x 65535 x 1
  Maximum memory pitch:                          262144 bytes
  Texture alignment:                             256 bytes
  Clock rate:                                    0.95 GHz
  Concurrent copy and execution:                 Yes
Using device 0: Quadro FX 570M
Processing time: 14.922157 s

Using device 0: Quadro FX 570M
Processing time: 20.002654 s

Using device 0: Quadro FX 570M
Processing time: 18.668309 (s)



Total time is 53.593121 s

Press ENTER to exit...
作者: voodoo    时间: 2008-6-2 13:51

这个能做啥?
作者: James50    时间: 2008-6-2 13:56

同问,不玩游戏就能当CPU使,比方压片会快很多?
作者: 意大利人在俄罗斯的奇遇    时间: 2008-6-2 13:59

lss的回复是关键。

[ 本帖最后由 意大利人在俄罗斯的奇遇 于 2008-6-2 14:02 编辑 ]
作者: 久多良木健    时间: 2008-6-2 14:04

引用:
原帖由 James50 于 2008-6-2 13:56 发表
同问,不玩游戏就能当CPU使,比方压片会快很多?
nvidia不是演示过这个吗
photoshop打开4g的图像,秒速,各种滤镜变化,秒速,压片要看压什么,一部电影mp4几百秒,h264十几分钟
作者: 超越梦想    时间: 2008-6-2 14:09

LS正解啊,比如原来压几小时的活只要20分钟。。。想想都兴奋
作者: hyh    时间: 2008-6-2 14:22

我怎么觉得是硬威大想死了
作者: sceic    时间: 2008-6-2 14:51

驱动之家上周有篇新闻,一国外实验室团队用4块9800当CPU+自制主板攒了台PC,能跑XP,和5F结论一样,打开什么都是秒速。。。
作者: OpEth    时间: 2008-6-2 14:52

nVIDIA为什么不去做cpu?
作者: 自由无限    时间: 2008-6-2 20:06

引用:
原帖由 OpEth 于 2008-6-2 14:52 发表
nVIDIA为什么不去做cpu?
除非收购AMD或者是VIA,否者做不来,因为技术专利问题
作者: arex    时间: 2008-6-2 20:37

Total time is 19.?????? s
作者: sztzh    时间: 2008-6-2 22:47

17.753468s
作者: alfano    时间: 2008-6-2 22:48

引用:
原帖由 自由无限 于 2008-6-2 20:06 发表

除非收购AMD或者是VIA,否者做不来,因为技术专利问题
快把AMD收购了吧
作者: hmds    时间: 2008-6-2 23:00

好像说intel不同意的话,任何人都别想买AMD
作者: 索尼反装x    时间: 2008-6-2 23:05

引用:
原帖由 OpEth 于 2008-6-2 14:52 发表
nVIDIA为什么不去做cpu?
x86技术intel不开口没人能做。。。。
作者: 超越梦想    时间: 2008-6-2 23:09

至少NV现在已经对移动设备CPU下手了,难怪之前老黄说CPU已死啊,没点底气也不敢说,桌面级别似乎还比较遥远

不管怎么说,手上有G80或以上显卡的用户,真正参与CPU的部分工作在近端时间是可以实现的了,CUDA现在很火。

[ 本帖最后由 超越梦想 于 2008-6-2 23:13 编辑 ]
作者: 超越梦想    时间: 2008-6-2 23:11

另外这个程序似乎对VISTA支持不友好,同样XP能到20S以内,我VISTA用了1分钟

There is 1 device supporting CUDA

Device 0: "GeForce 9600 GT"
  Major revision number:                         1
  Minor revision number:                         1
  Total amount of global memory:                 536870912 bytes
  Number of multiprocessors:                     8
  Number of cores:                               64
  Total amount of constant memory:               65536 bytes
  Total amount of shared memory per block:       16384 bytes
  Total number of registers available per block: 8192
  Warp size:                                     32
  Maximum number of threads per block:           512
  Maximum sizes of each dimension of a block:    512 x 512 x 64
  Maximum sizes of each dimension of a grid:     65535 x 65535 x 1
  Maximum memory pitch:                          262144 bytes
  Texture alignment:                             256 bytes
  Clock rate:                                    1.60 GHz
  Concurrent copy and execution:                 No
Using device 0: GeForce 9600 GT
Processing time: 4.596366 s

Using device 0: GeForce 9600 GT
Processing time: 46.500223 s

Using device 0: GeForce 9600 GT
Processing time: 9.378310 (s)



Total time is 60.474899 s

Press ENTER to exit...
作者: ddaaii    时间: 2008-6-3 11:36

我很能体会lz买了96gt后的兴奋
不过用这台机器通宵下bt,月底就拿着帐单哭吧




欢迎光临 TGFC Lifestyle (http://bbs.tgfcer.com/) Powered by Discuz! 6.0.0