»
首页
|
手机数码
|
汽车资讯
|
游戏硬件
|
评测专题
|
手机壁纸
|
海淘值得买
|
度假
|
求职招聘
|
广告联系
» 您尚未登录:请
登录
|
注册
|
标签
|
帮助
|
小黑屋
|
TGFC Lifestyle
»
完全数码讨论区
» 用G80或以上级别N卡的用户有福了!!!初步测试用GPU充当CPU的工作!!!
发新话题
发布投票
发布商品
发布悬赏
发布活动
发布辩论
发布视频
打印
[电脑]
用G80或以上级别N卡的用户有福了!!!初步测试用GPU充当CPU的工作!!!
超越梦想
魔神至尊
请叫我奶爸
帖子
20173
精华
0
积分
47540
激骚
343 度
爱车
KIA K3
主机
PSP
相机
GF1+2017神饼
手机
Mate10 P30
来自
欢乐第一
注册时间
2003-3-16
发短消息
加为好友
当前离线
1
#
大
中
小
发表于 2008-6-2 13:49
显示全部帖子
转自PCI
【Update,可以得到正确core数目】写了个CUDA程序,测试GPU性能,请发出你的结果
【updata】:需要看core数目的朋友们可以下载更新的版本,不需要你更新显卡驱动就可以得到multiprocessors和cores的正确值。
对测试结果没有影响。
要CUDA在本机能够运行,需要有以下条件:
1,有G80以上级别的显卡,这里有详细列表:
http://www.nvidia.com/object/cuda_learn_products.html
2,请装最新驱动,检查你的驱动是否支持CUDA的方法是,在你的Windows/system32目录中检查是否有这两个文件:nvcuda.dll,nvapi.dll
nv推荐驱动如下,和普通驱动的区别是里面包含了cuda的支持。
xp:
http://www.nvidia.com/object/thankyou.html?url=/compute/cuda/2.0-Beta/NVIDIADisplayWin2K(174_55)Int0414.exe
xp-64:
http://www.nvidia.com/object/thankyou.html?url=/compute/cuda/2.0-Beta/NVIDIADisplayWin2KAMD64(174_55)Int0414.exe
vista:
http://www.nvidia.com/object/thankyou.html?url=/compute/cuda/2.0-Beta/NVIDIADisplayWinVista(174_55)Int0414.exe
vista-64:
http://www.nvidia.com/object/thankyou.html?url=/compute/cuda/2.0-Beta/NVIDIADisplayWinVista64(174_55)Int0414.exe
3,有CUDA的运行库,我已经提取出来,放在压缩包里了。
这个小程序只是测试一下你的GPU计算一些通用算法所需要的时间,在最后会打出总的消耗时间。
下面是我的FX570M显卡的结果52s,欢迎大家也贴出自己的。
注意,水平有限,对SLI不支持,只能有一个显卡在计算。
CUDA的计算过程没有对CPU的调用,至于CPU占有率的问题,是CPU在处理和显卡之间的数据同步,CPU陷入了对OS内核中断的处理,而不是说CPU本身在参与CUDA的计算,对此怀疑的同志们可以放心了,呵呵。
可以看callstack结果:
ntkrnlpa.exe!KiUnexpectedInterrupt+0x121
ntkrnlpa.exe!ZwYieldExecution+0x1c8e
hal.dll+0x2ef2
hal.dll!HalMakeBeep+0x413
ntkrnlpa.exe!KeReleaseInStackQueuedSpinLockFromDpcLevel+0xb74
ntdll.dll!KiFastSystemCallRet
nvcuda.dll+0xc79ff
nvcuda.dll!cuTexRefGetFlags+0x44c8
nvcuda.dll!cuLaunchGridAsync+0x8e
cudart.dll+0x13174
cudart.dll+0x12396
cudart.dll!cudaLaunch+0x53
miniGPUTest.exe+0x1860
新版测试程序下载地址:xp版本:
http://www.mediafire.com/?mbogfnqu95z
vista 版本 :
http://www.mediafire.com/?mmwbtnrgwch
--------------------------------------------------------------
There is 1 device supporting CUDA
Device 0: "Quadro FX 570M"
Major revision number: 1
Minor revision number: 1
Total amount of global memory: 268107776 bytes
Number of multiprocessors: 4
Number of cores: 32
Total amount of constant memory: 65536 bytes
Total amount of shared memory per block: 16384 bytes
Total number of registers available per block: 8192
Warp size: 32
Maximum number of threads per block: 512
Maximum sizes of each dimension of a block: 512 x 512 x 64
Maximum sizes of each dimension of a grid: 65535 x 65535 x 1
Maximum memory pitch: 262144 bytes
Texture alignment: 256 bytes
Clock rate: 0.95 GHz
Concurrent copy and execution: Yes
Using device 0: Quadro FX 570M
Processing time: 14.922157 s
Using device 0: Quadro FX 570M
Processing time: 20.002654 s
Using device 0: Quadro FX 570M
Processing time: 18.668309 (s)
Total time is 53.593121 s
Press ENTER to exit...
UID
10263
帖子
20173
精华
0
积分
47540
交易积分
0
阅读权限
40
来自
欢乐第一
在线时间
29713 小时
注册时间
2003-3-16
最后登录
2025-8-26
查看个人网站
查看详细资料
TOP
超越梦想
魔神至尊
请叫我奶爸
帖子
20173
精华
0
积分
47540
激骚
343 度
爱车
KIA K3
主机
PSP
相机
GF1+2017神饼
手机
Mate10 P30
来自
欢乐第一
注册时间
2003-3-16
发短消息
加为好友
当前离线
2
#
大
中
小
发表于 2008-6-2 14:09
显示全部帖子
LS正解啊,比如原来压几小时的活只要20分钟。。。想想都兴奋
UID
10263
帖子
20173
精华
0
积分
47540
交易积分
0
阅读权限
40
来自
欢乐第一
在线时间
29713 小时
注册时间
2003-3-16
最后登录
2025-8-26
查看个人网站
查看详细资料
TOP
超越梦想
魔神至尊
请叫我奶爸
帖子
20173
精华
0
积分
47540
激骚
343 度
爱车
KIA K3
主机
PSP
相机
GF1+2017神饼
手机
Mate10 P30
来自
欢乐第一
注册时间
2003-3-16
发短消息
加为好友
当前离线
3
#
大
中
小
发表于 2008-6-2 23:09
显示全部帖子
至少NV现在已经对移动设备CPU下手了,难怪之前老黄说CPU已死啊,没点底气也不敢说,桌面级别似乎还比较遥远
不管怎么说,手上有G80或以上显卡的用户,真正参与CPU的部分工作在近端时间是可以实现的了,CUDA现在很火。
[
本帖最后由 超越梦想 于 2008-6-2 23:13 编辑
]
UID
10263
帖子
20173
精华
0
积分
47540
交易积分
0
阅读权限
40
来自
欢乐第一
在线时间
29713 小时
注册时间
2003-3-16
最后登录
2025-8-26
查看个人网站
查看详细资料
TOP
超越梦想
魔神至尊
请叫我奶爸
帖子
20173
精华
0
积分
47540
激骚
343 度
爱车
KIA K3
主机
PSP
相机
GF1+2017神饼
手机
Mate10 P30
来自
欢乐第一
注册时间
2003-3-16
发短消息
加为好友
当前离线
4
#
大
中
小
发表于 2008-6-2 23:11
显示全部帖子
另外这个程序似乎对VISTA支持不友好,同样XP能到20S以内,我VISTA用了1分钟
There is 1 device supporting CUDA
Device 0: "GeForce 9600 GT"
Major revision number: 1
Minor revision number: 1
Total amount of global memory: 536870912 bytes
Number of multiprocessors: 8
Number of cores: 64
Total amount of constant memory: 65536 bytes
Total amount of shared memory per block: 16384 bytes
Total number of registers available per block: 8192
Warp size: 32
Maximum number of threads per block: 512
Maximum sizes of each dimension of a block: 512 x 512 x 64
Maximum sizes of each dimension of a grid: 65535 x 65535 x 1
Maximum memory pitch: 262144 bytes
Texture alignment: 256 bytes
Clock rate: 1.60 GHz
Concurrent copy and execution: No
Using device 0: GeForce 9600 GT
Processing time: 4.596366 s
Using device 0: GeForce 9600 GT
Processing time: 46.500223 s
Using device 0: GeForce 9600 GT
Processing time: 9.378310 (s)
Total time is 60.474899 s
Press ENTER to exit...
UID
10263
帖子
20173
精华
0
积分
47540
交易积分
0
阅读权限
40
来自
欢乐第一
在线时间
29713 小时
注册时间
2003-3-16
最后登录
2025-8-26
查看个人网站
查看详细资料
TOP
控制面板首页
密码修改
积分交易
积分记录
公众用户组
基本概况
版块排行
主题排行
发帖排行
积分排行
交易排行
在线时间
管理团队
管理统计