GPU比CPU时间慢,我的GPU实现了什么毛病?

5视图(30天)

显示旧的评论

Ruby傅 2012年1月19日

0
链接

这个问题直接联系

//www.tatmou.com/matlabcentral/answers/26552-gpu-time-slower-than-cpu-time-what-went-wrong-with-my-gpu-implementation

评论道: ALysko2015年4月14日

答:接受本Tordoff

你好,我一直在测试在MATLAB GPU计算特性。下面的代码是运行和时机大矩阵乘法(1024 x1024)使用CPU和GPU计算:

                         一个=兰德(1024);
                        
                         gA = gpuArray(一个);
                        
                         %热身
                        
                         为i = 1:10
                        
                         C =一个*;
                        
                         gC = gA *遗传算法;
                        
                         结束
                        
                         抽搐,C =一个*,toc;
                        
                         抽搐,gC = gA *遗传算法;toc;

经过多次试验,结果使用CPU是速度比GPU的时间。我感到惊讶,因为这家伙stackoverflow论坛上做了精确的测试和他证明使用GPU更快:

                         > > =兰德(1024);gA = gpuArray(一个);
                        
                         %热身通过执行操作几次,然后:
                        
                         > >抽搐,C =一个*;toc
                        
                         运行时间是0.075396秒。
                        
                         > >抽搐,gC = gA *遗传算法;toc
                        
                         运行时间是0.008621秒。

我能想到的唯一原因是,我们使用的是不同的gpu。另一个人有一个特斯拉C2070虽然我使用笔记本电脑是戴尔Inspirion17R (NVIDIA GeForce GT 525)。

可能是有可能通过使用一个较小的GPU,计算实际上是低于使用CPU ?

谢谢你！Ruby

1评论
显示没有隐藏没有

ALysko 2015年4月14日

一点额外的信息关于双精度性能:

特斯拉C2070和GeForce GT 525是两个截然不同的gpu:特斯拉C2070: 1.03 tflops / 0.515 tflops(单/双精度)GeForce GT 525: 0.23 tflops / 0.031 tflops

泰坦黑色可能需要手动切换到启用双精度:

1)web页面 http://nvidianews.nvidia.com/news/nvidia-introduces-geforce-gtx-titan-dna-of-the-world-s-fastest-supercomputer-powered-by-world-s-fastest-gpu 44页的PDF”geforce - update - 2月- 2014年。pdf”说泰坦黑色单精度浮点运算的5.1双Precision1.3浮点运算

2)网页 http://www.bit-tech.net/news/hardware/2014/02/18/nvidia-gtx-titan-black-launched/1 比较了泰坦黑只是泰坦(由Mathworks测试):泰坦布莱克:5.1 tflops / 1.2 tflops泰坦:4.5 tflops / 1.3 tflops

(因此,泰坦的基准Mathworks应该相同或比泰坦黑色的基准)

3)页面https://devtalk.nvidia.com/default/topic/716573/gtx-titan-double-precision-flops-way-off-specs/专门谈论Mathworks基准与gpuBench ():

任何更改之前(默认设置):MTimes_D Backslash_D FFT_D MTimes_S Backslash_S FFT_S特斯拉C2075 333 246 73 696 435 163 GF GTX泰坦223 82 77 3635 179 252

(换卡后进入控制面板双精度):MTimes_D Backslash_D FFT_D MTimes_S Backslash_S FFT_S特斯拉C2075 333 246 73 696 435 163 GeForce GTX泰坦1285 128 146 3423 182 227

4)如何转换成双精度(限制了GPU时钟提升): http://www.hardwarecanucks.com/forum/hardware -加人队reviews/59785 nvidia geforce - gtx泰坦- 6 gb -性能-评估- 2. - html http://forums.evga.com/When-to-Use-Double-Precision-under-NVIDIA-Control-Panel-Manage-3D-Settings-m2252867.aspx http://nvidia.custhelp.com/app/answers/detail/a_id/3130/ ~ / setting-power-management-mode-from-adaptive-to-maximum-performance http://www.hardwarecanucks.com/forum/hardware -加人队reviews/59785 nvidia geforce - gtx泰坦- 6 gb -性能-评估- 2. - html linux: http://ambermd.org/gpus/

登录置评。

在回答这个问题。

接受的答案

本Tordoff 2012年1月20日

1
链接

直接链接到这个答案

//www.tatmou.com/matlabcentral/answers/26552-gpu-time-slower-than-cpu-time-what-went-wrong-with-my-gpu-implementation answer_34692

嗨,红宝石,

我刚刚上传的文件交换的基准测试工具运行负载的这些类型的时间把你的GPU在上下文与他人在市场上:

//www.tatmou.com/matlabcentral/fileexchange/34080-gpubench

要记住的一件事是,几乎所有的gpu没有显式地为科学计算优化设计为单精度数学(使用OpenGL等)。GeForce卡、移动或否则,单精度性能不错,但通常是双8 x。MATLAB默认使用双精度无处不在。NVIDIA的卡片,只有特斯拉和高端住宅区系列在双精度。加上一个移动GPU通常比台式机更少的核心,我很惊讶,如果你看到任何重大的加速而现代移动CPU时双精度数学。

总之,尝试基准,让我们都知道你会发现。

干杯

本