» 您尚未登录:请 登录 | 注册 | 标签 | 帮助 | 小黑屋 |


发新话题
打印

[电脑] 用G80或以上级别N卡的用户有福了!!!初步测试用GPU充当CPU的工作!!!

转自PCI

【Update,可以得到正确core数目】写了个CUDA程序,测试GPU性能,请发出你的结果

【updata】:需要看core数目的朋友们可以下载更新的版本,不需要你更新显卡驱动就可以得到multiprocessors和cores的正确值。

对测试结果没有影响。



要CUDA在本机能够运行,需要有以下条件:
1,有G80以上级别的显卡,这里有详细列表:http://www.nvidia.com/object/cuda_learn_products.html
2,请装最新驱动,检查你的驱动是否支持CUDA的方法是,在你的Windows/system32目录中检查是否有这两个文件:nvcuda.dll,nvapi.dll
nv推荐驱动如下,和普通驱动的区别是里面包含了cuda的支持。
xp:           http://www.nvidia.com/object/thankyou.html?url=/compute/cuda/2.0-Beta/NVIDIADisplayWin2K(174_55)Int0414.exe
xp-64:        http://www.nvidia.com/object/thankyou.html?url=/compute/cuda/2.0-Beta/NVIDIADisplayWin2KAMD64(174_55)Int0414.exe
vista:         http://www.nvidia.com/object/thankyou.html?url=/compute/cuda/2.0-Beta/NVIDIADisplayWinVista(174_55)Int0414.exe
vista-64:    http://www.nvidia.com/object/thankyou.html?url=/compute/cuda/2.0-Beta/NVIDIADisplayWinVista64(174_55)Int0414.exe

3,有CUDA的运行库,我已经提取出来,放在压缩包里了。

这个小程序只是测试一下你的GPU计算一些通用算法所需要的时间,在最后会打出总的消耗时间。

下面是我的FX570M显卡的结果52s,欢迎大家也贴出自己的。

注意,水平有限,对SLI不支持,只能有一个显卡在计算。

CUDA的计算过程没有对CPU的调用,至于CPU占有率的问题,是CPU在处理和显卡之间的数据同步,CPU陷入了对OS内核中断的处理,而不是说CPU本身在参与CUDA的计算,对此怀疑的同志们可以放心了,呵呵。

可以看callstack结果:

ntkrnlpa.exe!KiUnexpectedInterrupt+0x121
ntkrnlpa.exe!ZwYieldExecution+0x1c8e
hal.dll+0x2ef2
hal.dll!HalMakeBeep+0x413
ntkrnlpa.exe!KeReleaseInStackQueuedSpinLockFromDpcLevel+0xb74
ntdll.dll!KiFastSystemCallRet
nvcuda.dll+0xc79ff
nvcuda.dll!cuTexRefGetFlags+0x44c8
nvcuda.dll!cuLaunchGridAsync+0x8e
cudart.dll+0x13174
cudart.dll+0x12396
cudart.dll!cudaLaunch+0x53
miniGPUTest.exe+0x1860



新版测试程序下载地址:xp版本:http://www.mediafire.com/?mbogfnqu95z

                                   vista 版本 : http://www.mediafire.com/?mmwbtnrgwch

--------------------------------------------------------------
There is 1 device supporting CUDA

Device 0: "Quadro FX 570M"
  Major revision number:                         1
  Minor revision number:                         1
  Total amount of global memory:             268107776 bytes
  Number of multiprocessors:               4
  Number of cores:                                 32
  Total amount of constant memory:               65536 bytes
  Total amount of shared memory per block:       16384 bytes
  Total number of registers available per block: 8192
  Warp size:                                     32
  Maximum number of threads per block:           512
  Maximum sizes of each dimension of a block:    512 x 512 x 64
  Maximum sizes of each dimension of a grid:     65535 x 65535 x 1
  Maximum memory pitch:                          262144 bytes
  Texture alignment:                             256 bytes
  Clock rate:                                    0.95 GHz
  Concurrent copy and execution:                 Yes
Using device 0: Quadro FX 570M
Processing time: 14.922157 s

Using device 0: Quadro FX 570M
Processing time: 20.002654 s

Using device 0: Quadro FX 570M
Processing time: 18.668309 (s)



Total time is 53.593121 s

Press ENTER to exit...


TOP

LS正解啊,比如原来压几小时的活只要20分钟。。。想想都兴奋



TOP

至少NV现在已经对移动设备CPU下手了,难怪之前老黄说CPU已死啊,没点底气也不敢说,桌面级别似乎还比较遥远

不管怎么说,手上有G80或以上显卡的用户,真正参与CPU的部分工作在近端时间是可以实现的了,CUDA现在很火。

[ 本帖最后由 超越梦想 于 2008-6-2 23:13 编辑 ]


TOP

另外这个程序似乎对VISTA支持不友好,同样XP能到20S以内,我VISTA用了1分钟

There is 1 device supporting CUDA

Device 0: "GeForce 9600 GT"
  Major revision number:                         1
  Minor revision number:                         1
  Total amount of global memory:                 536870912 bytes
  Number of multiprocessors:                     8
  Number of cores:                               64
  Total amount of constant memory:               65536 bytes
  Total amount of shared memory per block:       16384 bytes
  Total number of registers available per block: 8192
  Warp size:                                     32
  Maximum number of threads per block:           512
  Maximum sizes of each dimension of a block:    512 x 512 x 64
  Maximum sizes of each dimension of a grid:     65535 x 65535 x 1
  Maximum memory pitch:                          262144 bytes
  Texture alignment:                             256 bytes
  Clock rate:                                    1.60 GHz
  Concurrent copy and execution:                 No
Using device 0: GeForce 9600 GT
Processing time: 4.596366 s

Using device 0: GeForce 9600 GT
Processing time: 46.500223 s

Using device 0: GeForce 9600 GT
Processing time: 9.378310 (s)



Total time is 60.474899 s

Press ENTER to exit...

TOP

发新话题
     
官方公众号及微博