主要内容

将深度学习数据上传到云端

此示例显示如何将数据上载到Amazon S3存储桶。

在您在云中执行深度学习培训之前,您需要将数据上传到云。该示例显示了如何将CiFar-10数据设置为计算机,然后将数据上传到Amazon S3存储桶,供以后在MATLAB中使用。CIFAR-10数据集是一个标记的图像数据集,通常用于基准测试图像分类算法。在运行此示例之前,您需要访问Amazon Web服务(AWS)帐户。将数据设置为Amazon S3后,您可以尝试任何示例深度学习并行和云中

将CiFar-10下载到本地机器

指定下载数据集的本地目录。以下代码在当前目录中创建一个文件夹,其中包含数据集中的所有图像。

目录= PWD;[TrainDirectory,TestDirectory] ​​= DownloadCardofolders(目录);
下载CiFar-10数据集...完成。将CiFar-10复制到文件夹......完成。

将本地数据上传到Amazon S3桶

要使用云中的数据,可以上载到Amazon S3,然后使用数据存储来从群集中的工人访问S3中的数据。以下步骤描述了如何将从本地计算机上传到Amazon S3存储桶的CIFAR-10数据。

1.对于往返Amazon S3的有效文件传输,下载和安装AWS命令行界面工具https://aws.amazon.com/cli/

2.将AWS访问键ID,秘密访问密钥和桶的区域作为系统环境变量指定。联系AWS帐户管理员以获取您的密钥。

例如,在Linux、macOS或Unix上,指定以下变量:

导出aws_access_key_id =“your_aws_access_key_id”导出aws_secret_access_key =“your_aws_secret_access_key”导出aws_default_region =“Use-East-1”

在Windows上,指定这些变量:

set AWS_ACCESS_KEY_ID="YOUR_AWS_ACCESS_KEY_ID" set AWS_SECRET_ACCESS_KEY="YOUR_AWS_SECRET_ACCESS_KEY" set AWS_DEFAULT_REGION="us-east-1"

要永久地指定这些环境变量,请在您的用户或系统环境中设置它们。

3.使用AWS S3网页或命令(如以下命令)为数据创建存储桶:

AWS S3 MB S3:// mynewbucket

4.使用以下命令(如以下命令)上传您的数据:

Aws s3 cp mylocaldatapath s3://mynewbucket——recursive

例如:

AWS S3 CP路径/到/ CIFAR10 / IN / LOCAL / MACHILS S3:// MyExampleCloudData / CiFar10 /  - 持久性

5.通过在MATLAB中完成以下步骤,将您的AWS凭据复制到集群工作人员:

的。环境一节选项卡,选择平行>创建和管理群集

b。集群配置文件窗格中,选择您的云集群配置文件。

C。在里面特性选项卡,选择环境变量属性,滚动如必要的找到属性。

d.单击窗口右下方的编辑

e。单击右侧的框环境变量然后然后键入这三个变量,每个变量在其自己的行上:aws_access_key_id.AWS_SECRET_ACCESS_KEY,aws_default_region.

f.在窗口右下方,单击完成

有关如何创建云群集的信息,请参阅创建云集群(并行计算工具箱)

使用MATLAB中的数据集

将数据存储在Amazon S3中后,您可以使用数据存储来访问群集工人的数据。只需创建一个指向S3存储桶的URL的数据存储。以下示例代码显示了如何使用imageDatastore访问S3桶。代替's3:// myexampleclouddata / cifar10 /火车'S3桶的URL。

imds = imageageatastore('s3:// myexampleclouddata / cifar10 /火车'......“IncludeSubfolders”,真的,......“LabelSource”'foldernames');

使用现在存储在Amazon S3中的CiFar-10数据集,您可以尝试任何示例深度学习并行和云中展示了如何在不同的用例中使用CIFAR-10。

也可以看看

相关的话题