用MATLAB和NVIDIA NGC加速深度学习训练

发布的Johanna Pingel，2021年5月3日

35次观看(过去30天)|0喜欢|0评论

本文由NVIDIA高级产品营销经理Akhil Docca和MathWorks人工智能合作伙伴经理Andy The共同撰写

简介

数据科学家、研究人员和开发人员需要合适的软件工具来轻松构建、优化和测试他们的AI应用程序，而不必担心复杂的环境，相互依赖，以及运行应用程序所需的驱动程序。此外，他们需要能够扩展和向外扩展，以减少网络训练时间，从而实现快速迭代，并增加在本地或云中运行工作负载的灵活性。

为了简化整个过程，MATLAB与NVIDIA NGC合作，将其最新软件封装并交付给gpu加速的AI工作流程。

容器和NVIDIA NGC

容器是一种可移植的软件单元，它将应用程序及其所有依赖项组合到一个包中。它与底层主机操作系统无关，不需要构建复杂的环境，简化了应用程序开发到部署的过程。

的NVIDIA NGC目录是一个gpu优化的AI和HPC软件中心，包括容器、预训练模型、sdk和Helm图表，旨在简化和加速AI工作流程。NGC上的容器被扫描以寻找常见漏洞和暴露(cve)，并对Docker和Singularity运行时进行测试。它们在单gpu到多gpu到多节点系统上进行性能测试。此外，这些容器非常可移植，因为它们可以在本地、云端或边缘运行。

使用MATLAB NGC容器训练计算机视觉模型

本指南将帮助您在亚马逊EC2®P3实例上在云中运行MATLAB桌面。但是，您可以在您选择的CSP或本地系统上运行该容器。

MATLAB深度学习容器可在NVIDIA NGC目录．

请注意: MATLAB R2021a支金宝app持最新的NVIDIA安培gpu，并将很快在NVIDIA NGC目录中提供。

需求

Amazon®Web服务帐户
MATLAB深度学习容器中产品的MATLAB许可证。下载188bet金宝搏有关MathWorks容器许可的更多信息，请参见配置MathWorks容器的License(云平台许可)。
- 您可以通过MATLAB深度学习容器获取产品试用许可证下载188bet金宝搏云端深度学习的MATLAB试用版．

在AWS上创建EC2实例

登录您的AWS管理控制台并在“计算服务”下选择EC2。

图1:AWS管理控制台和服务列表

使用Amazon EC2控制台创建密钥对。确保您可以访问您的私钥，以便您可以登录到您的实例。

图2:EC2仪表板和键对的位置

图3:创建密钥对的对话框

请注意:确保在创建私钥对时下载并注意私钥的位置，因为这是作为管理员连接到实例的唯一方法。

启动Docker主机实例

登录到Amazon Web Services控制台。从Services菜单中选择EC2。单击启动实例按钮。

图4:从EC2仪表板启动EC2实例

在“选择AMI”页面上，导航到AWS市场并搜索NVIDIA深度学习AMI。选择NVIDIA深度学习AMI，它专为NVIDIA NGC容器和最新的gpu(包括NVIDIA安培gpu)而设计。

图5:在AWS市场中找到NVIDIA深度学习AMI

图6:选择启用NVIDIA GPU的实例

请注意:并非所有可用分区都提供P3实例。可用分区是在创建VPC时定义的。

在“配置实例”、“添加存储”和“添加标记”页面上，根据需要配置您的实例。如有必要，请在配置安全组页面上为您的实例选择或创建适当的安全组。

配置完成后，选择适当的密钥对选项并启动实例。确保您可以访问您的私钥，以便您可以登录到您的实例。

图7:为EC2实例选择公钥对

单击View Instances，并在初始化完成后选择正在运行的实例。通过单击复制图标复制公共IPv4 DNS地址。

图8:从EC2仪表板中定位并复制公共IPc4 DNS

使用“PuTTY”连接EC2实例

SSH隧道在客户端机器和容器会话之间创建一个加密通道，以便所有通信都是安全的。您必须这样做才能访问在EC2实例中运行的容器的桌面。

使用PuTTY连接到Docker主机实例，进入Category: Session > host Name (or IP Address)，输入' ubuntu@[您的公共IPv4 DNS地址]”

图9:配置的主机名腻子终端

转到Category: Connections > SSH > Auth，并导航到EC2实例的私钥位置。

图10:为PuTTY终端选择私钥对

要通过web浏览器连接，请设置到容器端口6080的隧道。

在Source port字段中，输入客户端机器上的空闲端口，例如6080。
在“Destination”字段中输入与集装箱端口6080连接的主机端口运行容器例如:localhost:6080。注意，必须使用localhost而不是主机实例的名称。

要通过VNC客户端进行连接，请设置到容器端口5901的隧道。

在Source port字段中，输入客户端机器上从5900开始的空闲端口，例如5901。
在“Destination”字段中输入与容器端口5901连接的主机端口，例如“localhost:5901”。注意，必须使用localhost而不是主机实例的名称。

图11:设置PuTTY终端的源端口和目标端口

如果在客户机上使用多个容器或运行VNC服务器，则必须增加客户机上的源端口，直到找到空闲端口，例如5902或6081。

单击“打开”，然后单击“是”，因为它只是确认您想要连接到该主机。

从NGC目录中提取并运行MATLAB容器

控件中复制容器映像释放的pull命令NVIDIA NGC目录中的MATLAB登录页．在Tags部分中，找到要运行的容器映像版本。在Pull列中，单击图标复制docker Pull命令。命令的格式为:

docker拉nvcr.io/partners/matlab:r20XYz

标签在哪里r20XYz必须替换为特定的MATLAB版本名，例如r2021a．确保pull命令的最后一部分与您想要使用的MATLAB版本匹配。

图12:从MATLAB NGC目录页面复制docker pull命令

粘贴码头工人拉命令进入SSH客户端，并在EC2实例上运行该命令。您不需要登录到NVIDIA容器注册表来提取容器映像。

图13:在PuTTY终端上粘贴docker pull命令

运行码头工人拉命令将MATLAB容器映像(~9GB)下载到主机EC2机器上。下载和提取大型容器映像可能需要一些时间。每个EC2实例只需提取容器一次。

运行MATLAB深度学习容器MATLAB NGC登陆页面：

图14:来自MATLAB NGC目录页面的docker run命令

确保运行命令的最后一部分与您想要使用的MATLAB版本匹配。

options -p hostport:containerport将容器内部的端口映射到Docker主机上的端口，以便您可以连接到容器桌面。容器使用的端口为:5901(用于VNC连接)、6080(用于web浏览器连接)。如果在同一个主机实例上部署多个容器，则必须增加主机端口，直到找到空闲端口为止。例如:

-p 5902:5901 -p 6081:6080

将docker pull命令粘贴到PuTTY中，并在EC2实例上运行该命令。您不需要登录到NVIDIA容器注册表来提取容器映像。

图15:在PuTTY终端上粘贴docker pull命令

MATLAB深度学习容器现在正在您的EC2机器上运行。

在容器中有三种访问MATLAB的方法，但在本例中我们将使用web浏览器。详情请参阅文档如果您想通过命令行界面或VNC客户端访问MATLAB容器。

要使用web浏览器连接，请使用URL:

http://localhost:6080

注意，必须使用localhost而不是主机实例的名称。

如果您增加了客户端端口安全地连接，此处以对应的主机端口编号为例，例如“6081”。

您将看到noVNC的登录屏幕。单击连接。当系统提示输入密码进入桌面时，请输入密码:

matlab

登录您的MathWorks.com帐户

使用桌面图标运行MATLAB，并使用MathWorks帐户登录。

图16:在web浏览器中从桌面启动MATLAB

如果无法使用MathWorks帐户登录，请检查帐户是否已连接到为云使用配置的许可证。要查看，请访问授权中心．

图17:在提示符下输入MathWorks Account凭据

图18:web浏览器中的MATLAB桌面

运行一个MATLAB深度学习的例子

要测试容器，可以运行创建简单的深度学习网络分类(深度学习工具箱)示例。要尝试此示例，双击该文件MNISTExample.mlx在MATLAB启动文件夹的“当前文件夹”窗格中。

图19:运行MNIST示例来测试深度学习设置

MATLAB支金宝app持使用多个gpu并行训练单个网络。要在MATLAB深度学习容器中启用多gpu训练，请使用trainingOptions函数设置'ExecutionEnvironment到multi-gpu”。有关使用多个GPU的更多训练选项，请参阅基于MATLAB的多gpu深度学习．

在实时图中观察网络的训练进度，以及验证精度、损失和时间消耗。