GPU反斜杠性能比CPU慢得多
8视图(30天)
显示旧的评论
Meme的年轻
2020年12月27日
我做数字功率流caclulation通过修改matpower的功能,一个开源的工具。通过修改其newtonpf函数。米,GPU计算可以实现。然而,我发现GPU性能远比CPU慢得多。当计算的内置case3012wp matpower, newtonpf矩阵。m将:
5725 * 5725稀疏双,b: 5725 * 1双。
的过程\ b在第一个迭代中newtonpf()通常会在0.01秒在我i7 - 10750 h + RTX 2070超级MSI-GL65。
但如果A和b是变成了GPU数组,\ b的过程需要以下时间如果是以下类型:
完整的双,0.8秒
稀疏的双4秒
完整的单,0.1秒
(稀疏单不支持)金宝app
为什么不同的表现?我想GPU可以做事情比CPU快得多。
文件附件如下。Atest稀疏,Agpu稀疏gpu数组。都是双打。
9日评论
Meme的年轻
2020年12月27日
正如我所提到的,RTX 2070超级笔记本版本。
名称:的GeForce 2070年RTX超级
指数:1
ComputeCapability:“7.5”
金宝appSupportsDouble: 1
DriverVersion: 10.2000
ToolkitVersion: 10.2000
MaxThreadsPerBlock: 1024
MaxShmemPerBlock: 49152
MaxThreadBlockSize (1024 1024 64):
MaxGridSize (2.1475 e + 09年65535 65535):
SIMDWidth: 32
TotalMemory: 8.5899 e + 09年
AvailableMemory: 5.6821 e + 09年
MultiprocessorCount: 40
ClockRateKHz: 1380000
ComputeMode:“默认”
GPUOverlapsTransfers: 1
KernelExecutionTimeout: 1
CanMapHostMemory: 1
Device金宝appSupported: 1
DeviceSelected: 1
答案(1)
马特·J
2020年12月27日
这个线程看起来相关。看来稀疏mldivide GPU预计要快。
13个评论
Meme的年轻
2020年12月28日
我发现稀疏gpu数组是慢的反斜杠\完整gpu数组。
使我感到惊奇的是,CPU稀疏阵列比GPU完整数组要快得多。这使得gpu计算功率流(通常是稀疏矩阵\)不吸引人。
我已经上传另一个zip文件垫文件和一个m文件相结合。运行的m文件,你可以看到不同。
马特·J
2020年12月28日
编辑:马特·J
2020年12月28日
你的条件数
Atest
矩阵是很差:
> >气孔导度(全(Atest))
ans =
2.1049 e + 06
条件好时,我发现提供的建议在我给你的链接工作非常有利:
N = 5725;
一个= sprand (N, N, 0.005);
= A。* + speye (N);
b =兰德(N, 1);
Ag) = gpuArray(一个);
bg = gpuArray (b);
时间(@ ()\ b)% 0.8228秒
时间(@ (pcg) (A, b, 1 e-6 1 e3))% 0.2709秒
gputimeit (@ () pcg (Ag)、bg 1 e-6 1 e3))% 0.0538秒
沃尔特·罗伯森
2020年12月28日
是否完整()的GPU比CPU的稀疏阵列,取决于稀疏。
一端,可以很容易地检测到一个空的稀疏阵列和CPU可能很快完成它。另一端,稀疏阵列主要是填写(名义上的稀疏)将更快的处理(GPU)。
Meme的年轻
2020年12月28日
谢谢你的男人,我想我们已经找到了GPU计算的局限性。遗憾的是,我想说,在大多数功率流计算电网超过300公共汽车,其雅可比矩阵的条件价值(Atest)在第一个迭代中接近1 e5 ~ 1 e6的顺序,我已经测试了。所以也许GPU计算的加速为这样的应用程序是没有意义的:(。我认为加快GPU更好的适合点削减,削减而不是矩阵。
Meme的年轻
2020年12月28日
我认为这是因为matlab并不提供真正的优化算法稀疏gpu-sparse-type矩阵。GPU计算是不支持和warrated CPU计算,因金宝app为它仍然是一个新开发的该技术。
Meme的年轻
2020年12月28日
简单的男人,e5 ~ 1 e6并不可怕。matlab将报告警告只有当你试图在一个矩阵反斜杠rcond≈1 e15汽油和反面≈1 e16天。你可以试试这个测试如果Atest \ Atest等于眼();的错误将在1 e-16数值精确,所以反斜杠Atest仍然是准确的。
Meme的年轻
2020年12月30日
你什么意思稀疏解算器算法奈特先生?喜欢pcg()吗?我有试过这样效率不如:使用amd()重新排序,LU decomp基于decomp和两个反斜杠,特别是当处理稀疏矩阵的类型,我上传
一个错误发生
无法完成的行动,因为页面所做的更改。重新加载页面更新状态。
你也可以从下面的列表中选择一个网站
表现最好的网站怎么走吗
选择中国网站(中文或英文)最佳站点的性能。其他MathWorks国家网站不优化的访问你的位置。