奇怪的分析器GPU错误?
1视图(30天)
显示旧的评论
我有一个循环,GPU上做一些操作。当我从命令行调用该函数时,每个时代都在96秒。当我从分析器调用它,每个时代大约需要4秒。CPU版本的代码运行在大约63秒。任何想法如何解决这个问题,我没有分析器GPU加速?我从分析器完全可以叫它,但这似乎是愚蠢的。这是代码的一部分,似乎受到这种现象的影响。r阵很大,例如,4000 x78000。
抽搐
r = gpuArray(单(r));
U_grad = gpuArray(单(0));
W = gpuArray(单(W '));
为k = 1: max_class
U_grad = U_grad + bsxfun (@times W (:, k), r);
结束
U_grad =双(收集(U_grad)) * (q);
toc