用MATLAB和NVIDIA NGC加速深度学习训练
简介
数据科学家、研究人员和开发人员需要合适的软件工具来轻松构建、优化和测试他们的AI应用程序,而不必担心复杂的环境,相互依赖,以及运行应用程序所需的驱动程序。此外,他们需要能够扩展和向外扩展,以减少网络训练时间,从而实现快速迭代,并增加在本地或云中运行工作负载的灵活性。 为了简化整个过程,MATLAB与NVIDIA NGC合作,将其最新软件封装并交付给gpu加速的AI工作流程。 |
容器和NVIDIA NGC
容器是一种可移植的软件单元,它将应用程序及其所有依赖项组合到一个包中。它与底层主机操作系统无关,不需要构建复杂的环境,简化了应用程序开发到部署的过程。
的NVIDIA NGC目录是一个gpu优化的AI和HPC软件中心,包括容器、预训练模型、sdk和Helm图表,旨在简化和加速AI工作流程。NGC上的容器被扫描以寻找常见漏洞和暴露(cve),并对Docker和Singularity运行时进行测试。它们在单gpu到多gpu到多节点系统上进行性能测试。此外,这些容器非常可移植,因为它们可以在本地、云端或边缘运行。
使用MATLAB NGC容器训练计算机视觉模型
本指南将帮助您在亚马逊EC2®P3实例上在云中运行MATLAB桌面。但是,您可以在您选择的CSP或本地系统上运行该容器。
MATLAB深度学习容器可在NVIDIA NGC目录.
请注意: MATLAB R2021a支金宝app持最新的NVIDIA安培gpu,并将很快在NVIDIA NGC目录中提供。 |
需求
- Amazon®Web服务帐户
- MATLAB深度学习容器中产品的MATLAB许可证。下载188bet金宝搏有关MathWorks容器许可的更多信息,请参见配置MathWorks容器的License(云平台许可)。
- 您可以通过MATLAB深度学习容器获取产品试用许可证下载188bet金宝搏云端深度学习的MATLAB试用版.
在AWS上创建EC2实例
登录您的AWS管理控制台并在“计算服务”下选择EC2。
图1:AWS管理控制台和服务列表
使用Amazon EC2控制台创建密钥对。确保您可以访问您的私钥,以便您可以登录到您的实例。
图2:EC2仪表板和键对的位置
图3:创建密钥对的对话框
请注意:确保在创建私钥对时下载并注意私钥的位置,因为这是作为管理员连接到实例的唯一方法。 |
启动Docker主机实例
登录到Amazon Web Services控制台。从Services菜单中选择EC2。单击启动实例按钮。
图4:从EC2仪表板启动EC2实例
在“选择AMI”页面上,导航到AWS市场并搜索NVIDIA深度学习AMI。选择NVIDIA深度学习AMI,它专为NVIDIA NGC容器和最新的gpu(包括NVIDIA安培gpu)而设计。
图5:在AWS市场中找到NVIDIA深度学习AMI
图6:选择启用NVIDIA GPU的实例
请注意:并非所有可用分区都提供P3实例。可用分区是在创建VPC时定义的。 |
在“配置实例”、“添加存储”和“添加标记”页面上,根据需要配置您的实例。如有必要,请在配置安全组页面上为您的实例选择或创建适当的安全组。
配置完成后,选择适当的密钥对选项并启动实例。确保您可以访问您的私钥,以便您可以登录到您的实例。
图7:为EC2实例选择公钥对
单击View Instances,并在初始化完成后选择正在运行的实例。通过单击复制图标复制公共IPv4 DNS地址。
图8:从EC2仪表板中定位并复制公共IPc4 DNS
使用“PuTTY”连接EC2实例
SSH隧道在客户端机器和容器会话之间创建一个加密通道,以便所有通信都是安全的。您必须这样做才能访问在EC2实例中运行的容器的桌面。
使用PuTTY连接到Docker主机实例,进入Category: Session > host Name (or IP Address),输入' ubuntu@[您的公共IPv4 DNS地址]”
图9:配置的主机名腻子终端
转到Category: Connections > SSH > Auth,并导航到EC2实例的私钥位置。
图10:为PuTTY终端选择私钥对
要通过web浏览器连接,请设置到容器端口6080的隧道。
- 在Source port字段中,输入客户端机器上的空闲端口,例如6080。
- 在“Destination”字段中输入与集装箱端口6080连接的主机端口运行容器例如:localhost:6080。注意,必须使用localhost而不是主机实例的名称。
要通过VNC客户端进行连接,请设置到容器端口5901的隧道。
- 在Source port字段中,输入客户端机器上从5900开始的空闲端口,例如5901。
- 在“Destination”字段中输入与容器端口5901连接的主机端口,例如“localhost:5901”。注意,必须使用localhost而不是主机实例的名称。
图11:设置PuTTY终端的源端口和目标端口
如果在客户机上使用多个容器或运行VNC服务器,则必须增加客户机上的源端口,直到找到空闲端口,例如5902或6081。
单击“打开”,然后单击“是”,因为它只是确认您想要连接到该主机。
从NGC目录中提取并运行MATLAB容器
控件中复制容器映像释放的pull命令NVIDIA NGC目录中的MATLAB登录页.在Tags部分中,找到要运行的容器映像版本。在Pull列中,单击图标复制docker Pull命令。命令的格式为:
docker拉nvcr.io/partners/matlab:r20XYz
标签在哪里r20XYz必须替换为特定的MATLAB版本名,例如r2021a.确保pull命令的最后一部分与您想要使用的MATLAB版本匹配。
图12:从MATLAB NGC目录页面复制docker pull命令
粘贴码头工人拉命令进入SSH客户端,并在EC2实例上运行该命令。您不需要登录到NVIDIA容器注册表来提取容器映像。
图13:在PuTTY终端上粘贴docker pull命令
运行码头工人拉命令将MATLAB容器映像(~9GB)下载到主机EC2机器上。下载和提取大型容器映像可能需要一些时间。每个EC2实例只需提取容器一次。
运行MATLAB深度学习容器MATLAB NGC登陆页面:
图14:来自MATLAB NGC目录页面的docker run命令
确保运行命令的最后一部分与您想要使用的MATLAB版本匹配。
options -p hostport:containerport将容器内部的端口映射到Docker主机上的端口,以便您可以连接到容器桌面。容器使用的端口为:5901(用于VNC连接)、6080(用于web浏览器连接)。如果在同一个主机实例上部署多个容器,则必须增加主机端口,直到找到空闲端口为止。例如:
-p 5902:5901 -p 6081:6080
将docker pull命令粘贴到PuTTY中,并在EC2实例上运行该命令。您不需要登录到NVIDIA容器注册表来提取容器映像。
图15:在PuTTY终端上粘贴docker pull命令
MATLAB深度学习容器现在正在您的EC2机器上运行。
在容器中有三种访问MATLAB的方法,但在本例中我们将使用web浏览器。详情请参阅文档如果您想通过命令行界面或VNC客户端访问MATLAB容器。
要使用web浏览器连接,请使用URL:
http://localhost:6080
注意,必须使用localhost而不是主机实例的名称。
如果您增加了客户端端口安全地连接,此处以对应的主机端口编号为例,例如“6081”。
您将看到noVNC的登录屏幕。单击连接。当系统提示输入密码进入桌面时,请输入密码:
matlab
登录您的MathWorks.com帐户
使用桌面图标运行MATLAB,并使用MathWorks帐户登录。
图16:在web浏览器中从桌面启动MATLAB
如果无法使用MathWorks帐户登录,请检查帐户是否已连接到为云使用配置的许可证。要查看,请访问授权中心.
图17:在提示符下输入MathWorks Account凭据
图18:web浏览器中的MATLAB桌面
运行一个MATLAB深度学习的例子
要测试容器,可以运行创建简单的深度学习网络分类(深度学习工具箱)示例。要尝试此示例,双击该文件MNISTExample.mlx在MATLAB启动文件夹的“当前文件夹”窗格中。
图19:运行MNIST示例来测试深度学习设置
MATLAB支金宝app持使用多个gpu并行训练单个网络。要在MATLAB深度学习容器中启用多gpu训练,请使用trainingOptions函数设置'ExecutionEnvironment到multi-gpu”。有关使用多个GPU的更多训练选项,请参阅基于MATLAB的多gpu深度学习.
在实时图中观察网络的训练进度,以及验证精度、损失和时间消耗。
图20:MNIST示例的训练进度图
恭喜你!您已经准备好使用MATLAB、NGC、AWS和NVIDIA gpu来学习更复杂的AI示例。
访问MATLAB文档找到许多深度学习的例子,并访问预训练的模型,继续你的人工智能之旅。
请注意:按照步骤在您选择的CSP实例以及本地系统上运行容器。 |
接下来是什么
首先下载MATLAB容器来自NGC目录页面.
看到MATLAB容器文档对于其他主题,如:
- 在NVIDIA DGX系统上运行MATLAB NGC容器
- 导入和导出数据到AWS S3
- MATLAB授权选项
- 在MATLAB NGC容器中安装工具箱和加载项
- 使用VNC客户端连接到MATLAB
另外,一个新的MATLAB R2021a NGC容器将很快支持NVIDIA Ampere以及最新的CUD金宝appA 11.0和TensorRT 7.2。X库,敬请期待。
- 类别:
- 深度学习
评论
如欲留言,请点击在这里登录您的MathWorks帐户或创建一个新帐户。