使用GPU编码器™ 为CUDA®代码生成,安装中指定的产品下载188bet金宝搏安装必备产品下载188bet金宝搏.
当使用GPU编码器生成CUDA MEX时,代码生成器使用NVIDIA®MATLAB附带的编译器和库®. 根据开发计算机上的操作系统,您只需设置MEX代码生成器。
如果你有多个版本微软®Visual Studio®Windows上安装的C/C++语言编译器®系统中,MATLAB选择一个作为默认编译器。如果所选编译器与GPU编码器支持的版本不兼容,请更改选择。支持金宝app微软Visual Studio版本,请参阅安装必备产品下载188bet金宝搏.
要更改默认编译器,请使用安装程序C++
命令当你打电话的时候安装程序C++
,MATLAB显示一条消息,其中包含设置不同编译器的链接。选择链接并更改用于生成MEX文件的默认编译器。在调用之前,您选择的编译器将保持默认状态安装程序C++
选择其他默认值。有关详细信息,请参阅改变默认的编译器这个安装程序C++
命令只更改C++语言编译器。还必须使用C更改默认编译器墨西哥人设置C
.
MATLAB和CUDA工具包仅支持Linux下C/ c+金宝app+语言的GCC/ g++编译器®平台。有关支持金宝app的GCC/ g++版本,请参阅安装必备产品下载188bet金宝搏.
独立代码(静态库、动态链接库或可执行程序)的生成有额外的设置要求。GPU编码器使用环境变量来定位生成代码所需的必要工具、编译器和库。
请注意
在Windows上,工具、编译器和库路径中的空格或特殊字符可能会在生成过程中产生问题。您必须在不包含空格的位置安装第三方软件,或更改Windows设置,以便为文件、文件夹和路径创建短名称。有关详细信息,请参阅使用Windows短名称解决方案MATLAB答案.
平台 | 变量名 | 描述 |
---|---|---|
窗户 | CUDA_PATH |
CUDA工具包安装的路径。 例如:
|
NVIDIA_CUDNN |
cuDNN安装根文件夹的路径。根文件夹包含bin、include和lib子文件夹。 例如:
|
|
NVIDIA_TENSORRT |
TensorRT安装根文件夹的路径。根文件夹包含bin、data、include和lib子文件夹。 例如:
|
|
OPENCV_DIR |
主机上OpenCV的生成文件夹的路径。构建和运行深度学习示例需要此变量。 例如:
|
|
路径 |
CUDA可执行文件的路径。通常,CUDA工具包安装程序会自动设置这个值。 例如:
|
|
通往 例如:
|
||
通往 例如:
|
||
通往 例如:
|
||
OpenCV的动态链接库(DLL)路径。该变量是运行深度学习示例所必需的。 例如:
|
||
Linux | 路径 |
CUDA工具箱可执行文件的路径。 例如:
|
通往 例如:
|
||
OpenCV库的路径。此变量是构建和运行深度学习示例所必需的。 例如:
|
||
OpenCV头文件的路径。构建深度学习示例需要此变量。 例如:
|
||
LD_LIBRARY_PATH |
CUDA库文件夹的路径。 例如:
|
|
cuDNN库文件夹的路径。 例如:
|
||
通往TensorRT的道路™ 图书馆文件夹。 例如:
|
||
到达ARM的路径®目标硬件上的“计算库”文件夹。 例如:
集 |
||
NVIDIA_CUDNN |
cuDNN库安装的根文件夹路径。 例如:
|
|
NVIDIA_TENSORRT |
TensorRT库安装的根文件夹的路径。 例如:
|
|
ARM_COMPUTELIB |
ARM目标硬件上ARM计算库安装的根文件夹的路径。在ARM目标硬件上设置此值。 例如:
|
要验证您的开发计算机具有GPU代码生成所需的所有工具和配置,请使用coder.checkGpuInstall
函数。此函数执行检查以验证您的环境是否具有生成GPU代码所需的所有第三方工具和库。你必须通过coder.gpuEnvConfig
对象指向函数。此函数基于给定配置对象中指定的属性验证GPU代码生成环境。
您还可以使用等效的基于gui的应用程序,该应用程序执行相同的检查,并可以使用命令启动,检查显卡安装.
在MATLAB命令窗口中,输入:
gpuEnvObj = coder.gpuEnvConfig;gpuEnvObj。BasicCodegen = 1;gpuEnvObj。BasicCodeexec = 1;gpuEnvObj。DeepLibTarget =“tensorrt”; gpuEnvObj.DeepCodeexec=1;gpuEnvObj.DeepCodegen=1;结果=编码器检查gpuinstall(gpuEnvObj)
这里显示的输出具有代表性。结果可能会有所不同。
兼容GPU:通过CUDA环境:通过运行时:通过CUFT:通过cuSOLVER:通过cuBLAS:通过cuDNN环境:通过TensorRT环境:通过基本代码生成:通过基本代码执行:通过深度学习(TensorRT)代码生成:通过深度学习(TensorRT)代码执行:传递的结果=带字段的结构:gpu:1 cuda:1 cudnn:1 tensorrt:1 basiccodegen:1 basiccodeexec:1 deepcodegen:1 deepcodeexec:1 tensorrtdatatype:1评测:0