为CUDA使用GPU Coder™®C / C ++代码生成,安装指定的产品下载188bet金宝搏安装先决品产品下载188bet金宝搏。
使用GPU编码器生成CUDA MEX时,代码生成器使用NVIDIA®Matlab包含的编译器和库®。根据您的开发计算机上的操作系统,您只需要设置MEX代码生成器。
如果您有多个版本微软®视觉工作室®Windows上安装的C / C ++语言的编译器®MATLAB选择一个作为默认编译器。如果所选编译器与GPU编码器支持的版本不兼容,则更改选择。金宝app适用于支金宝app持Microsoft Visual Studio版本,参见安装先决品产品下载188bet金宝搏。
要更改默认编译器,请使用mex -setup c ++
命令。你打电话的时候mex -setup c ++
,Matlab显示带有链接的消息以设置不同的编译器。选择链接并更改构建MEX文件的默认编译器。您选择的编译器仍然是默认值,直到您致电mex -setup c ++
选择其他默认值。有关更多信息,请参阅更改默认编译器。这mex -setup c ++
命令仅更改C ++语言编译器。您还必须通过使用更改C的默认编译器mex -setup c.
。
Matlab和CUDA Toolkit仅支持Linux上金宝app的C / C ++语言的GCC / G ++编译器®平台。对于支持金宝app的GCC / G ++版本,请参阅安装先决品产品下载188bet金宝搏。
独立代码(静态库,动态链接库或可执行程序)生成具有额外的设置要求。GPU编码器使用环境变量来找到代码生成所需的必要工具,编译器和库。
笔记
在Windows中,在工具,编译器和库的路径中的空间或特殊字符可以在构建过程中创建问题。您必须在不包含空格或更改Windows设置的位置安装第三方软件,以便为文件,文件夹和路径创建短名称。有关更多信息,请参阅使用Windows短名称解决方案matlab答案。
平台 | 变量的名称 | 描述 |
---|---|---|
视窗 | cuda_path. |
CUDA Toolkit安装的路径。 例如:
|
nvidia_cudnn. |
CUDNN安装的根文件夹的路径。根文件夹包含BIN,包含和lib子文件夹。 例如:
|
|
nvidia_tensorrt. |
tensorrt安装的根文件夹的路径。根文件夹包含bin,数据,包含和lib子文件夹。 例如:
|
|
OpenCV_DIR. |
对主机上OpenCV的构建文件夹的路径。构建和运行深度学习示例需要此变量。 例如:
|
|
小路 |
对CUDA可执行文件的路径。通常,CUDA Toolkit安装程序自动设置此值。 例如:
|
|
往来的道路 例如:
|
||
往来的道路 例如:
|
||
OpenCV的动态链路库(DLL)的路径。运行深度学习示例需要此变量。 例如:
|
||
Linux. | 小路 |
对CUDA Toolkit可执行的路径。 例如:
|
opencv库的路径。构建和运行深度学习示例需要此变量。 例如:
|
||
opencv标题文件的路径。构建深度学习示例需要此变量。 例如:
|
||
ld_library_path. |
对CUDA库文件夹的路径。 例如:
|
|
CUDNN库文件夹的路径。 例如:
|
||
tensorrt™库文件夹的路径。 例如:
|
||
arm®计算目标硬件上的库文件夹。 例如:
放 |
||
nvidia_cudnn. |
CUDNN库安装的根文件夹的路径。 例如:
|
|
nvidia_tensorrt. |
tensorrt库安装的根夹的路径。 例如:
|
|
ARM_Comptelib. |
ARM计算库安装在ARM目标硬件上的root文件夹的路径。在ARM目标硬件上设置此值。 例如:
|
要验证您的开发计算机是否具有GPU代码生成所需的所有工具和配置,请使用Coder.CheckGPuInstall.
功能。此函数执行检查以验证您的环境是否具有GPU代码生成所需的所有第三方工具和库。你必须通过一个coder.gpuenvconfig.
对象函数。此函数根据给定配置对象中指定的属性验证GPU代码生成环境。
您还可以使用执行相同的检查的等效基于GUI的应用程序,并且可以使用命令启动检查GPU安装。
在MATLAB命令窗口中,输入:
gpuenvobj = coder.gpuenvconfig;gpuenvobj.basiccodegen = 1;gpuenvobj.basiccodeexec = 1;gpuenvobj.deeplibtarget ='tensorrt';gpuenvobj.deepcodeexec = 1;gpuenvobj.deepcodegen = 1;结果= Coder.CheckGPuInstall(GPUENVOBJ)
此处显示的输出是代表性的。你的结果可能有所不同。
兼容GPU:通过CUDA环境:通过了运行时:通过CUFFT:通过CUSOLVER:通过CUBBLAS:通过了CUDNN环境:通过了TENRT环境:通过基本代码:通过基本代码:通过深度学习(TensorR)代码生成:通过深度学习(Tensorrt)代码执行:传递结果=带有字段的结构:GPU:1 CUDA:1 CUDNN:1 TensorRT:1 BasicCodegen:1 BasicCodeExec:1 DeepCodeGEN:1 DENDCODEEXEC:1剖面:0