深度学习的数据集——MATLAB仿真软件金宝app - 金宝app,下载188bet金宝搏,金宝搏官方网站

深度学习的数据集

使用这些数据集与深度学习应用程序开始。

图像数据集

数据集描述任务

数据集	描述	任务
数字	10000年的数字数据集由合成手写数字灰度图像。28-by-28每个图像像素和有关联的标签表示数字图像代表(0 - 9)。每个图像一直旋转一定的角度。当加载图像阵列,您还可以加载图像的旋转角度。数字数据加载内存数值数组使用`digitTrain4DArrayData`和`digitTest4DArrayData`功能。 [XTrain, YTrain anglesTrain] = digitTrain4DArrayData;[XTest,欧美,anglesTest] = digitTest4DArrayData; 示例显示了如何处理这些数据的深度学习,明白了监测深度学习培训的进展和火车卷积神经网络回归。	图像分类和图像回归
数字数据加载图像数据存储使用`imageDatastore`功能和指定包含图像数据的文件夹。 dataFolder = fullfile (toolboxdir (“nnet”),“nndemos”,“nndatasets”,“DigitDataset”);imd = imageDatastore (dataFolder,…“IncludeSubfolders”,真的,…。“LabelSource”,“foldernames”); 为一个例子,演示如何处理这些数据深度学习,明白了创建简单的深度学习网络分类。	图像分类
MNIST (代表)	MNIST数据集包含70000份手写数字分成训练集和测试分区60000年和10000年的图像,分别。28-by-28每个图像像素和有关联的标签表示数字图像代表(0 - 9)。下载MNIST文件http://yann.lecun.com/exdb/mnist/和负载数据集到工作区中。加载的数据文件,MATLAB数组,提取,并将工作目录中的文件,然后使用helper函数`processImagesMNIST`和`processLabelsMNIST`使用的例子火车变分Autoencoder (VAE)来生成图像。在媒介=目录(fullfile (matlabroot“例子”,“nnet”,“主要”));filenameImagesTrain =“train-images.idx3-ubyte”;filenameLabelsTrain =“train-labels.idx1-ubyte”;filenameImagesTest =“t10k-images.idx3-ubyte”;filenameLabelsTest =“t10k-labels.idx1-ubyte”;XTrain = processImagesMNIST (filenameImagesTrain);YTrain = processLabelsMNIST (filenameLabelsTrain);XTest = processImagesMNIST (filenameImagesTest);欧美= processLabelsMNIST (filenameLabelsTest); 为一个例子,演示如何处理这些数据深度学习,明白了火车变分Autoencoder (VAE)来生成图像。恢复路径,使用`路径`函数。路径(媒介);	图像分类
Omniglot	Omniglot数据集包含50个字母的字符集,分为30集培训和20集进行测试。每个字母都包含一个字符数,从14 Ojibwe(加拿大原住民音节)曾到55。最后,每个角色都有20个手写的观察。下载并提取Omniglot数据集[1]从https://github.com/brendenlake/omniglot。集`downloadFolder`数据的位置。 downloadFolder = tempdir;url =“https://github.com/brendenlake/omniglot/raw/master/python”;urlTrain = url +“/ images_background.zip”;urlTest = url +“/ images_evaluation.zip”;filenameTrain = fullfile (downloadFolder,“images_background.zip”);filenameTest = fullfile (downloadFolder,“images_evaluation.zip”);dataFolderTrain = fullfile (downloadFolder,“images_background”);dataFolderTest = fullfile (downloadFolder,“images_evaluation”);如果~存在(dataFolderTrain“dir”)流(“下载Omniglot训练数据集(4.5 MB)…”)websave (filenameTrain urlTrain);解压缩(filenameTrain downloadFolder);流(“完成。\ n”)结束如果~存在(dataFolderTest“dir”)流(“下载Omniglot测试数据(3.2 MB)…”)websave (filenameTest urlTest);解压缩(filenameTest downloadFolder);流(“完成。\ n”)结束负荷训练和测试数据的图像数据存储,使用`imageDatastore`函数。手动指定标签从文件中提取标签名称和设置`标签`财产。 imdsTrain = imageDatastore (dataFolderTrain,…“IncludeSubfolders”,真的,…“LabelSource”,“没有”);文件= imdsTrain.Files;部分=分裂(文件、filesep);标签=加入(部分(:,(end-2): (end-1)),“_”);imdsTrain。标签= categorical(labels); imdsTest = imageDatastore(dataFolderTest,…“IncludeSubfolders”,真的,…“LabelSource”,“没有”);文件= imdsTest.Files;部分=分裂(文件、filesep);标签=加入(部分(:,(end-2): (end-1)),“_”);imdsTest。标签= categorical(labels); 为一个例子,演示如何处理这些数据深度学习,明白了火车暹罗网络比较图像。	图像相似度
花图片致谢:[3][4][5][6]	花的花朵数据集包含3670张图片属于五类(黛西,蒲公英,玫瑰,向日葵,郁金香)。下载并提取花数据集[2]从http://download.tensorflow.org/example_images/flower_photos.tgz。数据集是关于218 MB。根据您的网络连接,下载过程可能需要一些时间。集`downloadFolder`数据的位置。 url =“http://download.tensorflow.org/example_images/flower_photos.tgz”;downloadFolder = tempdir;文件名= fullfile (downloadFolder,“flower_dataset.tgz”);dataFolder = fullfile (downloadFolder,“flower_photos”);如果~存在(dataFolder“dir”)流(“花下载数据集(218 MB)…”)websave(文件名,url);解压(文件名,downloadFolder)流(“完成。\ n”)结束加载数据作为一个图像数据存储使用`imageDatastore`功能和指定包含图像数据的文件夹。 imd = imageDatastore (dataFolder,…“IncludeSubfolders”,真的,…“LabelSource”,“foldernames”); 为一个例子,演示如何处理这些数据深度学习,明白了火车生成对抗网络(甘)。	图像分类
例如食物图片	食物的例子图像数据集包含978年9类食物的照片(ceaser_salad,caprese_salad,french_fries,greek_salad,汉堡,hot_dog,披萨,生鱼片,寿司)。下载并解压示例食物图像数据集//www.tatmou.com/金宝appsupportfiles/nnet/data/ExampleFoodImageDataset.zip。这个数据集是关于77 MB。根据您的网络连接,下载过程可能需要一些时间。集`downloadFolder`数据的位置。 url =“//www.tatmou.com/金宝appsupportfiles/nnet/data/ExampleFoodImageDataset.zip”;downloadFolder = tempdir;文件名= fullfile (downloadFolder,“ExampleFoodImageDataset.zip”);dataFolder = fullfile (downloadFolder,“ExampleFoodImageDataset”);如果~存在(dataFolder“dir”)流(“下载示例食物图像数据集(77 MB)……”)websave(文件名,url);解压缩(文件名,downloadFolder);流(“完成。\ n”)结束为一个例子,演示如何处理这些数据深度学习,明白了视图使用tsne网络行为。	图像分类
CIFAR-10 (代表)	CIFAR-10数据集包含60000彩色图像的大小32-by-32像素,属于10类(飞机,汽车,鸟,猫,鹿,狗,青蛙,马,船,卡车)。有6000个图像每个类和数据集分为训练集50000张图片和10000张照片的测试集。该数据集是一种最广泛使用的数据集进行测试的新图像分类模型。下载并提取CIFAR-10数据集[7]从https://www.cs.toronto.edu/%7Ekriz/cifar-10-matlab.tar.gz。数据集是关于175 MB。根据您的网络连接,下载过程可能需要一些时间。集`downloadFolder`数据的位置。 url =“https://www.cs.toronto.edu/ ~ kriz / cifar-10-matlab.tar.gz”;downloadFolder = tempdir;文件名= fullfile (downloadFolder,“cifar-10-matlab.tar.gz”);dataFolder = fullfile (downloadFolder,“cifar-10-batches-mat”);如果~存在(dataFolder“dir”)流(“下载CIFAR-10数据集(175 MB)…”);websave(文件名、url);解压(文件名,downloadFolder);流(“完成。\ n”)结束将数据转换成数值型数组使用helper函数`loadCIFARData`使用的例子火车残余网络图像分类。在媒介=目录(fullfile (matlabroot“例子”,“nnet”,“主要”));[XTrain, YTrain XValidation YValidation] = loadCIFARData (downloadFolder); 为一个例子,演示如何处理这些数据深度学习,明白了火车残余网络图像分类。恢复路径,使用`路径`函数。路径(媒介);	图像分类
MathWorks^®营销上	这是一个小数据集包含75的图像MathWorks商品,属于五个不同的类(帽,多维数据集,打牌,螺丝刀,火炬)。您可以使用此数据集尝试转移迅速学习和图像分类。大小的图像是227 - 227 - 3。提取MathWorks营销数据集。文件名=“MerchData.zip”;dataFolder = fullfile (tempdir,“MerchData”);如果~存在(dataFolder“dir”解压缩(文件名,tempdir);结束加载数据作为一个图像数据存储使用`imageDatastore`功能和指定包含图像数据的文件夹。 imd = imageDatastore (dataFolder,…“IncludeSubfolders”,真的,…。“LabelSource”,“foldernames”); 示例显示了如何处理这些数据的深度学习,明白了学习开始转移和火车深入学习网络对新图像进行分类。	图像分类
CamVid	CamVid数据集是一组图像包含街道视图获得汽车驱动。数据集是用于训练网络执行的语义分割图像和提供了32进行像素级标签语义类,包括车,行人,路。大小的图像是720 - 960 - 3。下载并提取CamVid数据集[8]从http://web4.cs.ucl.ac.uk/staff/g.brostow/MotionSegRecData。数据集是关于573 MB。根据您的网络连接,下载过程可能需要一些时间。集`downloadFolder`数据的位置。 downloadFolder = tempdir;url =“http://web4.cs.ucl.ac.uk/staff/g.brostow/MotionSegRecData”urlImages = url +“/文件/ 701 _stillsraw_full.zip”;urlLabels = url +“/数据/ LabeledApproved_full.zip”;dataFolder = fullfile (downloadFolder,“CamVid”);dataFolderImages = fullfile (dataFolder,“图片”);dataFolderLabels = fullfile (dataFolder,“标签”);filenameLabels = fullfile (dataFolder,“labels.zip”);filenameImages = fullfile (dataFolder,“images.zip”);如果~存在(filenameLabels“文件”)\| \| ~存在(imagesZip“文件”mkdir (dataFolder)流(“下载CamVid图像数据集(557 MB)…”);websave (filenameImages urlImages);解压缩(filenameImages dataFolderImages);流(“完成。\ n”)流(“下载CamVid数据集标签(16 MB)…”);websave (filenameLabels urlLabels);解压缩(filenameLabels dataFolderLabels);流(“完成。\ n”)结束加载数据作为一个像素标签数据存储使用`pixelLabelDatastore`函数包含标签数据,并指定文件夹类,标签id。使训练更容易,组32原始类数据集到11类。标签标识,使用helper函数`camvidPixelLabelIDs`使用的例子语义分割使用深度学习。在媒介=目录(fullfile (matlabroot“例子”,“deeplearning_shared”,“主要”));imd = imageDatastore (dataFolderImages,“IncludeSubfolders”,真正的);类= [“天空”“建筑”“极”“路”“路面”“树”…“SignSymbol”“篱笆”“汽车”“行人”“自行车”];labelIDs = camvidPixelLabelIDs;pxds = pixelLabelDatastore (dataFolderLabels、类labelIDs); 为一个例子,演示如何处理这些数据深度学习,明白了语义分割使用深度学习。恢复路径,使用`路径`函数。路径(媒介);	语义分割
车辆	295年的车辆数据集由图像包含一个或两个标记的实例。这个小数据集用于探索YOLO-v2训练过程,但在实践中,需要更多的标签图片来训练一个健壮的探测器。大小的图像是720 - 960 - 3。提取车辆数据集。`dataFolder`数据的位置。文件名=“vehicleDatasetImages.zip”;dataFolder = fullfile (tempdir,“vehicleImages”);如果~存在(dataFolder“dir”解压缩(文件名,tempdir);结束负载作为一个表的数据集提取文件名和边界框的垫文件和文件名转换为绝对的文件路径。 data =负载(“vehicleDatasetGroundTruth.mat”);vehicleDataset = data.vehicleDataset;vehicleDataset。imageFilename = fullfile (tempdir vehicleDataset.imageFilename); 创建一个图像数据存储包含图片和一盒标签包含边界框使用的数据存储`imageDatastore`和`boxLabelDatastore`函数,分别。结合生成的数据存储使用`结合`函数。 filenamesImages = vehicleDataset.imageFilename;tblBoxes = vehicleDataset (:,“汽车”);imd = imageDatastore (filenamesImages);建筑物= boxLabelDatastore (tblBoxes);cd =结合(imd,建筑物); 为一个例子,演示如何处理这些数据深度学习,明白了对象检测使用YOLO v2意思深入学习。	对象检测
RIT-18	RIT-18数据集包含了图像数据被一架无人机在哈姆林海滩州立公园,在纽约州。数据包含标签的训练、验证和测试集,包括18个对象类标签路标,树,建筑。下载RIT-18数据集[9]从https://www.cis.rit.edu/%7Ermk6217/rit18_data.mat。数据集是关于3 GB。根据您的网络连接,下载过程可能需要一些时间。集`downloadFolder`数据的位置。 downloadFolder = tempdir;url =“http://www.cis.rit.edu/ ~ rmk6217 / rit18_data.mat”;文件名= fullfile (downloadFolder,“rit18_data.mat”);如果~存在(文件名,“文件”)流(“下载哈姆林海滩的数据集(3 GB)…”);websave(文件名、url);流(“完成。\ n”)结束为一个例子,演示如何处理这些数据深度学习,明白了多光谱图像的语义分割使用深度学习。	语义分割
有钱的孩子	小鬼数据集包含了脑部肿瘤的MRI扫描,即神经胶质瘤,这是最常见的原发性脑恶性肿瘤。数据集包含750个4 - d卷,每个代表一个堆栈的3 d图像。每个4 d体积大小240 - - 240 - 155 - 4,在前三个维度对应高度,宽度和深度的三维体积的形象。第四维对应于不同的扫描方式。484数据集分为训练与体元标签和266个测试卷卷。创建一个目录来存储小鬼数据集[10]。 dataFolder = fullfile (tempdir,“小鬼”);如果~存在(dataFolder“dir”mkdir (dataFolder);结束下载的小鬼数据医学分割十项全能通过单击“下载数据”链接。下载“Task01_BrainTumour。焦油”文件。数据集是关于7 GB。根据您的网络连接,下载过程可能需要一些时间。 TAR文件提取到指定的目录`dataFolder`变量。那么,如果提取成功`dataFolder`包含一个目录命名`Task01_BrainTumour`这有三个子目录:`imagesTr`,`imagesTs`,`labelsTr`。为一个例子,演示如何处理这些数据深度学习,明白了三维大脑肿瘤分割使用深度学习。	语义分割
Camelyon16	Camelyon16挑战的数据包含400 WSIs淋巴结从两个独立的来源,分为270 130训练图像和测试图像。气管无名动脉瘘管的WSIs被存储为文件剥夺格式11-level金字塔结构。 159年的训练数据集由WSIs正常淋巴结和111张幻灯片的图片(WSIs)淋巴结的肿瘤组织和健康组织。通常,肿瘤组织的一小部分健康的组织。地面实况病变边界伴随肿瘤图像的坐标。创建目录来存储Camelyon16数据集[11]。 dataFolderTrain = fullfile (tempdir,“Camelyon16”,“培训”);dataFolderNormalTrain = fullfile (dataFolderTrain,“正常”);dataFolderTumorTrain = fullfile (dataFolderTrain,“肿瘤”);dataFolderAnnotationsTrain = fullfile (dataFolderTrain,“lesion_annotations”);如果~存在(dataFolderTrain“dir”mkdir (dataFolderTrain);mkdir (dataFolderNormalTrain);mkdir (dataFolderTumorTrain);mkdir (dataFolderAnnotationsTrain);结束下载Camelyon16数据集Camelyon17点击第一个“CAMELYON16数据集”链接。打开“培训”目录中,然后按照以下步骤: 下载“lesion_annotations。邮政”文件。提取文件到指定的目录`dataFolderAnnotationsTrain`变量。打开“正常”的目录。图片下载到指定的目录`dataFolderNormalTrain`变量。打开“肿瘤”目录。图片下载到指定的目录`dataFolderTumorTrain`变量。数据集2 GB。根据您的网络连接,下载过程可能需要一些时间。为一个例子,演示如何处理这些数据深度学习,明白了深度学习分类的大型多分辨率图像。	图像分类(大图片)
常见的对象上下文(可可) (代表)	可可2014训练图像数据集包含82783张图片。注释数据包含至少五个标题对应每个图像。创建目录来存储可可数据集。 dataFolder = fullfile (tempdir,“可可”);如果~存在(dataFolder“dir”mkdir (dataFolder);结束下载并提取可可2014训练图像和字幕https://cocodataset.org/下载通过单击“2014训练图像”和“2014火车/ Val注释”链接,分别。数据保存在指定的文件夹`dataFolder`。从文件中提取标题`captions_train2014.json`使用`jsondecode`函数。文件名= fullfile (dataFolder,“annotations_trainval2014”,“注释”,…“captions_train2014.json”);str = fileread(文件名);data = jsondecode (str); 的`注释`结构的字段包含图像字幕所需的数据。为一个例子,演示如何处理这些数据深度学习,明白了图像字幕使用注意。	图像字幕
IAPR TC-12 (代表)	的IAPR TC-12基准由20000名仍然自然图像。数据集包括照片的人、动物、城市、和更多。数据文件的大小大约是1.8 GB。下载IAPR TC-12数据集。 dataDir = fullfile (tempdir,“iaprtc12”);url =“http://www-i6.informatik.rwth-aachen.de/imageclef/resources/iaprtc12.tgz”;如果~存在(dataDir“dir”)流(“下载IAPR TC-12数据集(1.8 GB)…\ n ');试一试解压(url, dataDir);抓%在一些Windows机器上,将命令解压错误. tgz%的文件。重命名.tg并再试一次。文件名= fullfile (tempdir,“iaprtc12.tg”);websave(文件名、url);解压(文件名,dataDir);结束流(“做。\ n \ n”);结束加载数据作为一个图像数据存储使用`imageDatastore`函数。指定包含图像数据的文件夹和文件扩展名。 imageDir = fullfile (dataDir,“图片”)ext = {“jpg”,bmp格式的,“使用”};imd = imageDatastore (imageDir,…“IncludeSubfolders”,真的,…“FileExtensions”ext); 为一个例子,演示如何处理这些数据深度学习,明白了单一图像超分辨率使用深度学习。	Image-to-image回归
苏黎世原始RGB	苏黎世原始RGB数据集包含48043注册对原始和RGB空间训练图像补丁的大小448 - - 448。数据集包含两个单独的测试集。一个测试集由1204空间注册对原始和RGB图像补丁的大小448 - - 448。未登记的全分辨率的其他测试集由原始和RGB图像。数据集的大小是22 GB。创建一个目录来存储数据集。 imageDir = fullfile (tempdir,“ZurichRAWToRGB”);如果~存在(imageDir“dir”mkdir (imageDir);结束下载的数据集,请求访问使用苏黎世原始RGB数据集的形式。提取数据到指定的目录`imageDir`变量。当提取成功,`imageDir`包含三个目录命名`full_resolution`,`测试`,`火车`。< p > 为一个例子,演示如何处理这些数据深度学习,明白了使用深度学习开发原始相机处理管道。	Image-to-image回归

数字

10000年的数字数据集由合成手写数字灰度图像。28-by-28每个图像像素和有关联的标签表示数字图像代表(0 - 9)。每个图像一直旋转一定的角度。当加载图像阵列,您还可以加载图像的旋转角度。

数字数据加载内存数值数组使用digitTrain4DArrayData和digitTest4DArrayData功能。

[XTrain, YTrain anglesTrain] = digitTrain4DArrayData;[XTest,欧美,anglesTest] = digitTest4DArrayData;

示例显示了如何处理这些数据的深度学习,明白了监测深度学习培训的进展和火车卷积神经网络回归。

图像分类和图像回归

数字数据加载图像数据存储使用imageDatastore功能和指定包含图像数据的文件夹。

dataFolder = fullfile (toolboxdir (“nnet”),“nndemos”,“nndatasets”,“DigitDataset”);imd = imageDatastore (dataFolder,…“IncludeSubfolders”,真的,…。“LabelSource”,“foldernames”);

为一个例子,演示如何处理这些数据深度学习,明白了创建简单的深度学习网络分类。

图像分类

MNIST

(代表)

MNIST数据集包含70000份手写数字分成训练集和测试分区60000年和10000年的图像,分别。28-by-28每个图像像素和有关联的标签表示数字图像代表(0 - 9)。

下载MNIST文件http://yann.lecun.com/exdb/mnist/和负载数据集到工作区中。加载的数据文件,MATLAB数组,提取,并将工作目录中的文件,然后使用helper函数processImagesMNIST和processLabelsMNIST使用的例子火车变分Autoencoder (VAE)来生成图像。

在媒介=目录(fullfile (matlabroot“例子”,“nnet”,“主要”));filenameImagesTrain =“train-images.idx3-ubyte”;filenameLabelsTrain =“train-labels.idx1-ubyte”;filenameImagesTest =“t10k-images.idx3-ubyte”;filenameLabelsTest =“t10k-labels.idx1-ubyte”;XTrain = processImagesMNIST (filenameImagesTrain);YTrain = processLabelsMNIST (filenameLabelsTrain);XTest = processImagesMNIST (filenameImagesTest);欧美= processLabelsMNIST (filenameLabelsTest);

为一个例子,演示如何处理这些数据深度学习,明白了火车变分Autoencoder (VAE)来生成图像。

恢复路径,使用路径函数。

路径(媒介);

图像分类

Omniglot

Omniglot数据集包含50个字母的字符集,分为30集培训和20集进行测试。每个字母都包含一个字符数,从14 Ojibwe(加拿大原住民音节)曾到55。最后,每个角色都有20个手写的观察。

下载并提取Omniglot数据集[1]从https://github.com/brendenlake/omniglot。集downloadFolder数据的位置。

downloadFolder = tempdir;url =“https://github.com/brendenlake/omniglot/raw/master/python”;urlTrain = url +“/ images_background.zip”;urlTest = url +“/ images_evaluation.zip”;filenameTrain = fullfile (downloadFolder,“images_background.zip”);filenameTest = fullfile (downloadFolder,“images_evaluation.zip”);dataFolderTrain = fullfile (downloadFolder,“images_background”);dataFolderTest = fullfile (downloadFolder,“images_evaluation”);如果~存在(dataFolderTrain“dir”)流(“下载Omniglot训练数据集(4.5 MB)…”)websave (filenameTrain urlTrain);解压缩(filenameTrain downloadFolder);流(“完成。\ n”)结束如果~存在(dataFolderTest“dir”)流(“下载Omniglot测试数据(3.2 MB)…”)websave (filenameTest urlTest);解压缩(filenameTest downloadFolder);流(“完成。\ n”)结束

负荷训练和测试数据的图像数据存储,使用imageDatastore函数。手动指定标签从文件中提取标签名称和设置标签财产。

imdsTrain = imageDatastore (dataFolderTrain,…“IncludeSubfolders”,真的,…“LabelSource”,“没有”);文件= imdsTrain.Files;部分=分裂(文件、filesep);标签=加入(部分(:,(end-2): (end-1)),“_”);imdsTrain。标签= categorical(labels); imdsTest = imageDatastore(dataFolderTest,…“IncludeSubfolders”,真的,…“LabelSource”,“没有”);文件= imdsTest.Files;部分=分裂(文件、filesep);标签=加入(部分(:,(end-2): (end-1)),“_”);imdsTest。标签= categorical(labels);

为一个例子,演示如何处理这些数据深度学习,明白了火车暹罗网络比较图像。

图像相似度

花

图片致谢:[3][4][5][6]

花的花朵数据集包含3670张图片属于五类(黛西,蒲公英,玫瑰,向日葵,郁金香)。

下载并提取花数据集[2]从http://download.tensorflow.org/example_images/flower_photos.tgz。数据集是关于218 MB。根据您的网络连接,下载过程可能需要一些时间。集downloadFolder数据的位置。

url =“http://download.tensorflow.org/example_images/flower_photos.tgz”;downloadFolder = tempdir;文件名= fullfile (downloadFolder,“flower_dataset.tgz”);dataFolder = fullfile (downloadFolder,“flower_photos”);如果~存在(dataFolder“dir”)流(“花下载数据集(218 MB)…”)websave(文件名,url);解压(文件名,downloadFolder)流(“完成。\ n”)结束

加载数据作为一个图像数据存储使用imageDatastore功能和指定包含图像数据的文件夹。

imd = imageDatastore (dataFolder,…“IncludeSubfolders”,真的,…“LabelSource”,“foldernames”);

为一个例子,演示如何处理这些数据深度学习,明白了火车生成对抗网络(甘)。

图像分类

例如食物图片

食物的例子图像数据集包含978年9类食物的照片(ceaser_salad,caprese_salad,french_fries,greek_salad,汉堡,hot_dog,披萨,生鱼片,寿司)。

下载并解压示例食物图像数据集//www.tatmou.com/金宝appsupportfiles/nnet/data/ExampleFoodImageDataset.zip。这个数据集是关于77 MB。根据您的网络连接,下载过程可能需要一些时间。集downloadFolder数据的位置。

url =“//www.tatmou.com/金宝appsupportfiles/nnet/data/ExampleFoodImageDataset.zip”;downloadFolder = tempdir;文件名= fullfile (downloadFolder,“ExampleFoodImageDataset.zip”);dataFolder = fullfile (downloadFolder,“ExampleFoodImageDataset”);如果~存在(dataFolder“dir”)流(“下载示例食物图像数据集(77 MB)……”)websave(文件名,url);解压缩(文件名,downloadFolder);流(“完成。\ n”)结束

为一个例子,演示如何处理这些数据深度学习,明白了视图使用tsne网络行为。

图像分类

CIFAR-10

(代表)

CIFAR-10数据集包含60000彩色图像的大小32-by-32像素,属于10类(飞机,汽车,鸟,猫,鹿,狗,青蛙,马,船,卡车)。

有6000个图像每个类和数据集分为训练集50000张图片和10000张照片的测试集。该数据集是一种最广泛使用的数据集进行测试的新图像分类模型。

下载并提取CIFAR-10数据集[7]从https://www.cs.toronto.edu/%7Ekriz/cifar-10-matlab.tar.gz。数据集是关于175 MB。根据您的网络连接,下载过程可能需要一些时间。集downloadFolder数据的位置。

url =“https://www.cs.toronto.edu/ ~ kriz / cifar-10-matlab.tar.gz”;downloadFolder = tempdir;文件名= fullfile (downloadFolder,“cifar-10-matlab.tar.gz”);dataFolder = fullfile (downloadFolder,“cifar-10-batches-mat”);如果~存在(dataFolder“dir”)流(“下载CIFAR-10数据集(175 MB)…”);websave(文件名、url);解压(文件名,downloadFolder);流(“完成。\ n”)结束

将数据转换成数值型数组使用helper函数loadCIFARData使用的例子火车残余网络图像分类。

在媒介=目录(fullfile (matlabroot“例子”,“nnet”,“主要”));[XTrain, YTrain XValidation YValidation] = loadCIFARData (downloadFolder);

为一个例子,演示如何处理这些数据深度学习,明白了火车残余网络图像分类。

恢复路径,使用路径函数。

路径(媒介);

图像分类

MathWorks^®营销上

这是一个小数据集包含75的图像MathWorks商品,属于五个不同的类(帽,多维数据集,打牌,螺丝刀,火炬)。您可以使用此数据集尝试转移迅速学习和图像分类。

大小的图像是227 - 227 - 3。

提取MathWorks营销数据集。

文件名=“MerchData.zip”;dataFolder = fullfile (tempdir,“MerchData”);如果~存在(dataFolder“dir”解压缩(文件名,tempdir);结束

加载数据作为一个图像数据存储使用imageDatastore功能和指定包含图像数据的文件夹。

imd = imageDatastore (dataFolder,…“IncludeSubfolders”,真的,…。“LabelSource”,“foldernames”);

示例显示了如何处理这些数据的深度学习,明白了学习开始转移和火车深入学习网络对新图像进行分类。

图像分类

CamVid

CamVid数据集是一组图像包含街道视图获得汽车驱动。数据集是用于训练网络执行的语义分割图像和提供了32进行像素级标签语义类,包括车,行人,路。

大小的图像是720 - 960 - 3。

下载并提取CamVid数据集[8]从http://web4.cs.ucl.ac.uk/staff/g.brostow/MotionSegRecData。数据集是关于573 MB。根据您的网络连接,下载过程可能需要一些时间。集downloadFolder数据的位置。

downloadFolder = tempdir;url =“http://web4.cs.ucl.ac.uk/staff/g.brostow/MotionSegRecData”urlImages = url +“/文件/ 701 _stillsraw_full.zip”;urlLabels = url +“/数据/ LabeledApproved_full.zip”;dataFolder = fullfile (downloadFolder,“CamVid”);dataFolderImages = fullfile (dataFolder,“图片”);dataFolderLabels = fullfile (dataFolder,“标签”);filenameLabels = fullfile (dataFolder,“labels.zip”);filenameImages = fullfile (dataFolder,“images.zip”);如果~存在(filenameLabels“文件”)| | ~存在(imagesZip“文件”mkdir (dataFolder)流(“下载CamVid图像数据集(557 MB)…”);websave (filenameImages urlImages);解压缩(filenameImages dataFolderImages);流(“完成。\ n”)流(“下载CamVid数据集标签(16 MB)…”);websave (filenameLabels urlLabels);解压缩(filenameLabels dataFolderLabels);流(“完成。\ n”)结束

加载数据作为一个像素标签数据存储使用pixelLabelDatastore函数包含标签数据,并指定文件夹类,标签id。使训练更容易,组32原始类数据集到11类。标签标识,使用helper函数camvidPixelLabelIDs使用的例子语义分割使用深度学习。

在媒介=目录(fullfile (matlabroot“例子”,“deeplearning_shared”,“主要”));imd = imageDatastore (dataFolderImages,“IncludeSubfolders”,真正的);类= [“天空”“建筑”“极”“路”“路面”“树”…“SignSymbol”“篱笆”“汽车”“行人”“自行车”];labelIDs = camvidPixelLabelIDs;pxds = pixelLabelDatastore (dataFolderLabels、类labelIDs);

为一个例子,演示如何处理这些数据深度学习,明白了语义分割使用深度学习。

恢复路径,使用路径函数。

路径(媒介);

语义分割

车辆

295年的车辆数据集由图像包含一个或两个标记的实例。这个小数据集用于探索YOLO-v2训练过程,但在实践中,需要更多的标签图片来训练一个健壮的探测器。

大小的图像是720 - 960 - 3。

提取车辆数据集。dataFolder数据的位置。

文件名=“vehicleDatasetImages.zip”;dataFolder = fullfile (tempdir,“vehicleImages”);如果~存在(dataFolder“dir”解压缩(文件名,tempdir);结束

负载作为一个表的数据集提取文件名和边界框的垫文件和文件名转换为绝对的文件路径。

data =负载(“vehicleDatasetGroundTruth.mat”);vehicleDataset = data.vehicleDataset;vehicleDataset。imageFilename = fullfile (tempdir vehicleDataset.imageFilename);

创建一个图像数据存储包含图片和一盒标签包含边界框使用的数据存储imageDatastore和boxLabelDatastore函数,分别。结合生成的数据存储使用结合函数。

filenamesImages = vehicleDataset.imageFilename;tblBoxes = vehicleDataset (:,“汽车”);imd = imageDatastore (filenamesImages);建筑物= boxLabelDatastore (tblBoxes);cd =结合(imd,建筑物);

为一个例子,演示如何处理这些数据深度学习,明白了对象检测使用YOLO v2意思深入学习。

对象检测

RIT-18

航拍照片哈姆林海滩国家公园有彩色像素标签覆盖表明地区草地,树木,沙滩,沥青和其他类”height=

RIT-18数据集包含了图像数据被一架无人机在哈姆林海滩州立公园,在纽约州。数据包含标签的训练、验证和测试集,包括18个对象类标签路标,树,建筑。

下载RIT-18数据集[9]从https://www.cis.rit.edu/%7Ermk6217/rit18_data.mat。数据集是关于3 GB。根据您的网络连接,下载过程可能需要一些时间。集downloadFolder数据的位置。

downloadFolder = tempdir;url =“http://www.cis.rit.edu/ ~ rmk6217 / rit18_data.mat”;文件名= fullfile (downloadFolder,“rit18_data.mat”);如果~存在(文件名,“文件”)流(“下载哈姆林海滩的数据集(3 GB)…”);websave(文件名、url);流(“完成。\ n”)结束

为一个例子,演示如何处理这些数据深度学习,明白了多光谱图像的语义分割使用深度学习。

语义分割

有钱的孩子

轴向片人类大脑有彩色像素标签叠加显示区域的正常组织和肿瘤组织”height=

小鬼数据集包含了脑部肿瘤的MRI扫描,即神经胶质瘤,这是最常见的原发性脑恶性肿瘤。

数据集包含750个4 - d卷,每个代表一个堆栈的3 d图像。每个4 d体积大小240 - - 240 - 155 - 4,在前三个维度对应高度,宽度和深度的三维体积的形象。第四维对应于不同的扫描方式。484数据集分为训练与体元标签和266个测试卷卷。

创建一个目录来存储小鬼数据集[10]。

dataFolder = fullfile (tempdir,“小鬼”);如果~存在(dataFolder“dir”mkdir (dataFolder);结束

下载的小鬼数据医学分割十项全能通过单击“下载数据”链接。下载“Task01_BrainTumour。焦油”文件。数据集是关于7 GB。根据您的网络连接,下载过程可能需要一些时间。

TAR文件提取到指定的目录dataFolder变量。那么,如果提取成功dataFolder包含一个目录命名Task01_BrainTumour这有三个子目录:imagesTr,imagesTs,labelsTr。

为一个例子,演示如何处理这些数据深度学习,明白了三维大脑肿瘤分割使用深度学习。

语义分割

Camelyon16

正常组织样本的六个补丁”height=

Camelyon16挑战的数据包含400 WSIs淋巴结从两个独立的来源,分为270 130训练图像和测试图像。气管无名动脉瘘管的WSIs被存储为文件剥夺格式11-level金字塔结构。

159年的训练数据集由WSIs正常淋巴结和111张幻灯片的图片(WSIs)淋巴结的肿瘤组织和健康组织。通常,肿瘤组织的一小部分健康的组织。地面实况病变边界伴随肿瘤图像的坐标。

创建目录来存储Camelyon16数据集[11]。

dataFolderTrain = fullfile (tempdir,“Camelyon16”,“培训”);dataFolderNormalTrain = fullfile (dataFolderTrain,“正常”);dataFolderTumorTrain = fullfile (dataFolderTrain,“肿瘤”);dataFolderAnnotationsTrain = fullfile (dataFolderTrain,“lesion_annotations”);如果~存在(dataFolderTrain“dir”mkdir (dataFolderTrain);mkdir (dataFolderNormalTrain);mkdir (dataFolderTumorTrain);mkdir (dataFolderAnnotationsTrain);结束

下载Camelyon16数据集Camelyon17点击第一个“CAMELYON16数据集”链接。打开“培训”目录中,然后按照以下步骤:

下载“lesion_annotations。邮政”文件。提取文件到指定的目录dataFolderAnnotationsTrain变量。
打开“正常”的目录。图片下载到指定的目录dataFolderNormalTrain变量。
打开“肿瘤”目录。图片下载到指定的目录dataFolderTumorTrain变量。

数据集2 GB。根据您的网络连接,下载过程可能需要一些时间。

为一个例子,演示如何处理这些数据深度学习,明白了深度学习分类的大型多分辨率图像。

图像分类(大图片)

常见的对象上下文(可可)

(代表)

可可2014训练图像数据集包含82783张图片。注释数据包含至少五个标题对应每个图像。

创建目录来存储可可数据集。

dataFolder = fullfile (tempdir,“可可”);如果~存在(dataFolder“dir”mkdir (dataFolder);结束

下载并提取可可2014训练图像和字幕https://cocodataset.org/下载通过单击“2014训练图像”和“2014火车/ Val注释”链接,分别。数据保存在指定的文件夹dataFolder。

从文件中提取标题captions_train2014.json使用jsondecode函数。

文件名= fullfile (dataFolder,“annotations_trainval2014”,“注释”,…“captions_train2014.json”);str = fileread(文件名);data = jsondecode (str);

的注释结构的字段包含图像字幕所需的数据。

为一个例子,演示如何处理这些数据深度学习,明白了图像字幕使用注意。

图像字幕

IAPR TC-12

城堡的墙和花园在塞维利亚王宫,西班牙”height=

(代表)

的IAPR TC-12基准由20000名仍然自然图像。数据集包括照片的人、动物、城市、和更多。数据文件的大小大约是1.8 GB。

下载IAPR TC-12数据集。

dataDir = fullfile (tempdir,“iaprtc12”);url =“http://www-i6.informatik.rwth-aachen.de/imageclef/resources/iaprtc12.tgz”;如果~存在(dataDir“dir”)流(“下载IAPR TC-12数据集(1.8 GB)…\ n ');试一试解压(url, dataDir);抓%在一些Windows机器上,将命令解压错误. tgz%的文件。重命名.tg并再试一次。文件名= fullfile (tempdir,“iaprtc12.tg”);websave(文件名、url);解压(文件名,dataDir);结束流(“做。\ n \ n”);结束

加载数据作为一个图像数据存储使用imageDatastore函数。指定包含图像数据的文件夹和文件扩展名。

imageDir = fullfile (dataDir,“图片”)ext = {“jpg”,bmp格式的,“使用”};imd = imageDatastore (imageDir,…“IncludeSubfolders”,真的,…“FileExtensions”ext);

为一个例子,演示如何处理这些数据深度学习,明白了单一图像超分辨率使用深度学习。

Image-to-image回归

苏黎世原始RGB

把原始和RGB图像补丁的苏黎世的街景”height=

苏黎世原始RGB数据集包含48043注册对原始和RGB空间训练图像补丁的大小448 - - 448。数据集包含两个单独的测试集。一个测试集由1204空间注册对原始和RGB图像补丁的大小448 - - 448。未登记的全分辨率的其他测试集由原始和RGB图像。数据集的大小是22 GB。

创建一个目录来存储数据集。

imageDir = fullfile (tempdir,“ZurichRAWToRGB”);如果~存在(imageDir“dir”mkdir (imageDir);结束

下载的数据集,请求访问使用苏黎世原始RGB数据集的形式。提取数据到指定的目录imageDir变量。当提取成功,imageDir包含三个目录命名full_resolution,测试,火车。< p >

为一个例子,演示如何处理这些数据深度学习,明白了使用深度学习开发原始相机处理管道。

Image-to-image回归

时间序列和信号数据集

数据描述任务

数据	描述	任务
日本的元音	日本元音数据集[12][13]包含预处理序列代表日本元音的话语从不同的扬声器。 `XTrain`和`XTest`细胞阵列包含维度12可变长度的序列。`YTrain`和`欧美`是分类向量的标签1到9,对应于九个扬声器。的条目`XTrain`与12矩阵行(每个特性的一行)和不同数量的列(每个时间步一列)。`XTest`是一个单元阵列包含370维度12可变长度的序列。日本元音数据加载设置为内存单元数组包含数字序列使用`japaneseVowelsTrainData`和`japaneseVowelsTestData`功能。 [XTrain, YTrain] = japaneseVowelsTrainData;[XTest,欧美]= japaneseVowelsTestData; 为一个例子,演示如何处理这些数据深度学习,明白了使用深度学习序列分类。	Sequence-to-label分类
水痘	水痘数据集包含一个时间序列,随着时间的推移步骤对应月和值对应于病例数量。输出是一个单元阵列,其中每个元素是一个时间步。加载水痘数据为一个单一的数字序列使用`chickenpox_dataset`函数。重塑一个行向量数据。数据= chickenpox_dataset;数据=({}):数据; 为一个例子,演示如何处理这些数据深度学习,明白了使用深度学习时间序列预测。	时间序列预测
人类活动	人类活动数据集包含7个传感器数据的时间序列来自智能手机戴在身体。每个序列有三个特性和不同长度。这三个特征对应于加速度计读数在三个不同的方向。载入人类活动数据集。 dataTrain =负载(“HumanActivityTrain”);人数(=负载(“HumanActivityTest”);XTrain = dataTrain.XTrain;YTrain = dataTrain.YTrain;XTest = dataTest.XTest;欧美= dataTest.YTest; 为一个例子,演示如何处理这些数据深度学习,明白了使用深度学习Sequence-to-Sequence分类。	Sequence-to-sequence分类
涡扇发动机退化模拟	涡扇发动机的每个时间序列退化模拟数据集[14]代表一个不同的引擎。每个引擎从开始未知程度的磨损和制造变化。引擎操作通常在每个时间序列的开始,并开发一个错误在某种程度上在系列。在训练集,断层生长在级到系统故障。数据包含一个zip压缩文本文件与26列的数字,用空格分开。每一行是一个快照的数据在一个运行周期,每一列是一个不同的变量。列对应如下: 列1 -单元号列2 -时间周期列3 - 5——操作设置列6-26——传感器测量1日到21日创建一个目录来存储涡扇发动机退化模拟数据集。 dataFolder = fullfile (tempdir,“涡扇”);如果~存在(dataFolder“dir”mkdir (dataFolder);结束下载并提取的涡扇发动机退化模拟数据集https://ti.arc.nasa.gov/tech/dash/groups/pcoe/prognostic-data-repository/。解压缩的数据文件`CMAPSSData.zip`。文件名=“CMAPSSData.zip”;解压缩(文件名,dataFolder) 负荷训练和测试数据使用辅助函数`processTurboFanDataTrain`和`processTurboFanDataTest`,分别。使用这些函数的例子使用深度学习Sequence-to-Sequence回归。在媒介=目录(fullfile (matlabroot“例子”,“nnet”,“主要”));filenamePredictors = fullfile (dataFolder,“train_FD001.txt”);[XTrain, YTrain] = processTurboFanDataTrain (filenamePredictors);filenamePredictors = fullfile (dataFolder,“test_FD001.txt”);filenameResponses = fullfile (dataFolder,“RUL_FD001.txt”);[XTest,欧美]= processTurboFanDataTest (filenamePredictors filenameResponses); 为一个例子,演示如何处理这些数据深度学习,明白了使用深度学习Sequence-to-Sequence回归。恢复路径,使用`路径`函数。路径(媒介);	Sequence-to-sequence回归,预测性维护
生理网2017年挑战	数据集的生理网2017年挑战[16]由一组的心电图记录采样在300赫兹,由一群专家分为四个不同的类:正常(N), AFib (a),其他节奏(O),和嘈杂的记录(~)。下载并提取数据集使用的生理网2017年挑战`ReadPhysionetData`脚本,用于示例使用长短期记忆网络的ECG信号进行分类。数据集是关于95 MB。根据您的网络连接,下载过程可能需要一些时间。在媒介=目录(fullfile (matlabroot“例子”,“deeplearning_shared”,“主要”));ReadPhysionetData data =负载(“PhysionetData.mat”)信号= data.Signals;标签= data.Labels; 为一个例子,演示如何处理这些数据深度学习,明白了使用长短期记忆网络的ECG信号进行分类。恢复路径,使用`路径`函数。路径(媒介);	Sequence-to-label分类
田纳西伊士曼过程(TEP)模拟	这个数据集包括垫文件从田纳西伊士曼转换过程(TEP)模拟数据。下载田纳西伊士曼过程(TEP)模拟数据集[15]从网站(见MathWorks支持文件金宝app免责声明)。数据集有四个组成部分:无故障的培训,绝对没错的测试,错误的训练,和错误的测试。每个文件单独下载。数据集是关于1.7 GB。根据您的网络连接,下载过程可能需要一些时间。 url金宝appSupportFiles =“//www.tatmou.com/金宝appsupportfiles/predmaint”;url = url金宝appSupportFiles +“/ chemical-process-fault-detection-data / faultytesting.mat”;流(“下载TEP错误的测试数据(1 GB)……”)websave (“faultytesting.mat”url);流(“完成。\ n”url = urlSu金宝apppportFiles +“/ chemical-process-fault-detection-data / faultytraining.mat”;流(“TEP错误的训练数据下载(613 MB)……”)websave (“faultytraining.mat”url);流(“完成。\ n”url = urlSu金宝apppportFiles +“/ chemical-process-fault-detection-data / faultfreetesting.mat”;流(“下载TEP无故障的测试数据(69 MB)……”)websave (“faultfreetesting.mat”url);流(“完成。\ n”url = urlSu金宝apppportFiles +“/ chemical-process-fault-detection-data / faultfreetraining.mat”;流(“下载TEP无故障的训练数据(36 MB)……”)websave (“faultfreetraining.mat”url);流(“完成。\ n”) 下载的文件加载到MATLAB^®工作区。负载(“faultfreetesting.mat”);负载(“faultfreetraining.mat”);负载(“faultytesting.mat”);负载(“faultytraining.mat”); 为一个例子,演示如何处理这些数据深度学习,明白了使用深度学习化工过程故障检测。	Sequence-to-label分类
生理网心电图分割	生理网心电图分类数据集[16][17]由大约15分钟共有105名患者的心电图记录。获得每个记录,审查员把两个电极放在不同的位置在一个病人的胸部,导致双通道信号。数据库提供了信号区域标签由一个自动生成专家系统。生理网下载心电图细分的数据集https://github.com/mathworks/physionet_ECG_segmentation通过下载的ZIP文件`QT_Database-master.zip`。数据集是关于72 MB。根据您的网络连接,下载过程可能需要一些时间。集`downloadFolder`数据的位置。 downloadFolder = tempdir;url =“https://github.com/mathworks/physionet_ECG_segmentation/raw/master/QT_Database-master.zip”;文件名= fullfile (downloadFolder,“QT_Database-master.zip”);dataFolder = fullfile (downloadFolder,“QT_Database-master”);如果~存在(dataFolder“dir”)流(生理网”下载心电图分类数据集(72 MB)…”)websave(文件名,url);解压缩(文件名,downloadFolder);流(“完成。\ n”)结束解创建文件夹`QT_Database-master`在你的临时目录中。这个文件夹包含的文本文件`README.md`和下列文件: `QTData.mat` `Modified_physionet_data.txt` `License.txt` `QTData.mat`包含生理网心电图细分数据。该文件`Modified_physionet_data.txt`提供了数据和源归因的描述操作应用到每个原始心电图记录。加载生理网垫心电图分割数据文件。负载(fullfile (dataFolder“QTData.mat”)) 为一个例子,演示如何处理这些数据深度学习,明白了波形分割使用深度学习。	Sequence-to-label分类、波形分割
合成行人、汽车和自行车反向散射	生成一个合成行人、汽车和自行车反向散射数据集使用辅助函数`helperBackScatterSignals`和`helperDopplerSignatures`使用的例子行人和自行车使用深度学习分类。辅助函数`helperBackScatterSignals`生成指定数量的行人、骑自行车和汽车雷达的回报。对于每一个实现,返回信号维度N在- - - - - -N缓慢的,N快的数量夏令时间样品和N缓慢的数量标准时间样本。辅助函数`helperDopplerSignatures`计算短时傅里叶变换)生成微多普勒雷达回波的签名。要获得微多普勒特征,使用辅助函数应用STFT和每个信号预处理方法。在媒介=目录(fullfile (matlabroot“例子”,“分阶段”,“主要”));numPed = 1;%的行人数量实现numBic = 1;%的自行车数量实现numCar = 1;%的数量汽车实现[xPedRec, xBicRec xCarRec Tsamp] = helperBackScatterSignals (numPed, numBic numCar);(加速、T、F) = helperDopplerSignatures (xPedRec Tsamp);[SBic, ~, ~] = helperDopplerSignatures (xBicRec Tsamp);[伤疤,~,~]= helperDopplerSignatures (xCarRec Tsamp); 为一个例子,演示如何处理这些数据深度学习,明白了行人和自行车使用深度学习分类。恢复路径,使用`路径`函数。路径(媒介);	Sequence-to-label分类
生成的波形	生成矩形,线性调频、相位编码使用helper函数波形`helperGenerateRadarWaveforms`使用的例子雷达波形分类使用深度学习。辅助函数`helperGenerateRadarWaveforms`产生3000信号的采样率为每个调制类型使用100 MHz`phased.RectangularWaveform`对于矩形脉冲,`phased.LinearFMWaveform`线性调频,`phased.PhaseCodedWaveform`相跟巴克码脉冲。在媒介=目录(fullfile (matlabroot“例子”,“分阶段”,“主要”));[wav, modType] = helperGenerateRadarWaveforms; 为一个例子,演示如何处理这些数据深度学习,明白了雷达波形分类使用深度学习。恢复路径,使用`路径`函数。路径(媒介);	Sequence-to-label分类

日本的元音

日本元音数据集[12][13]包含预处理序列代表日本元音的话语从不同的扬声器。

XTrain和XTest细胞阵列包含维度12可变长度的序列。YTrain和欧美是分类向量的标签1到9,对应于九个扬声器。的条目XTrain与12矩阵行(每个特性的一行)和不同数量的列(每个时间步一列)。XTest是一个单元阵列包含370维度12可变长度的序列。

日本元音数据加载设置为内存单元数组包含数字序列使用japaneseVowelsTrainData和japaneseVowelsTestData功能。

[XTrain, YTrain] = japaneseVowelsTrainData;[XTest,欧美]= japaneseVowelsTestData;

为一个例子,演示如何处理这些数据深度学习,明白了使用深度学习序列分类。

Sequence-to-label分类

水痘

水痘数据集包含一个时间序列,随着时间的推移步骤对应月和值对应于病例数量。输出是一个单元阵列,其中每个元素是一个时间步。

加载水痘数据为一个单一的数字序列使用chickenpox_dataset函数。重塑一个行向量数据。

数据= chickenpox_dataset;数据=({}):数据;

为一个例子,演示如何处理这些数据深度学习,明白了使用深度学习时间序列预测。

时间序列预测

人类活动

人类活动数据集包含7个传感器数据的时间序列来自智能手机戴在身体。每个序列有三个特性和不同长度。这三个特征对应于加速度计读数在三个不同的方向。

载入人类活动数据集。

dataTrain =负载(“HumanActivityTrain”);人数(=负载(“HumanActivityTest”);XTrain = dataTrain.XTrain;YTrain = dataTrain.YTrain;XTest = dataTest.XTest;欧美= dataTest.YTest;

为一个例子,演示如何处理这些数据深度学习,明白了使用深度学习Sequence-to-Sequence分类。

Sequence-to-sequence分类

涡扇发动机退化模拟

涡扇发动机的每个时间序列退化模拟数据集[14]代表一个不同的引擎。每个引擎从开始未知程度的磨损和制造变化。引擎操作通常在每个时间序列的开始,并开发一个错误在某种程度上在系列。在训练集,断层生长在级到系统故障。

数据包含一个zip压缩文本文件与26列的数字,用空格分开。每一行是一个快照的数据在一个运行周期,每一列是一个不同的变量。列对应如下:

列1 -单元号
列2 -时间周期
列3 - 5——操作设置
列6-26——传感器测量1日到21日

创建一个目录来存储涡扇发动机退化模拟数据集。

dataFolder = fullfile (tempdir,“涡扇”);如果~存在(dataFolder“dir”mkdir (dataFolder);结束

下载并提取的涡扇发动机退化模拟数据集https://ti.arc.nasa.gov/tech/dash/groups/pcoe/prognostic-data-repository/。

解压缩的数据文件CMAPSSData.zip。

文件名=“CMAPSSData.zip”;解压缩(文件名,dataFolder)

负荷训练和测试数据使用辅助函数processTurboFanDataTrain和processTurboFanDataTest,分别。使用这些函数的例子使用深度学习Sequence-to-Sequence回归。

在媒介=目录(fullfile (matlabroot“例子”,“nnet”,“主要”));filenamePredictors = fullfile (dataFolder,“train_FD001.txt”);[XTrain, YTrain] = processTurboFanDataTrain (filenamePredictors);filenamePredictors = fullfile (dataFolder,“test_FD001.txt”);filenameResponses = fullfile (dataFolder,“RUL_FD001.txt”);[XTest,欧美]= processTurboFanDataTest (filenamePredictors filenameResponses);

为一个例子,演示如何处理这些数据深度学习,明白了使用深度学习Sequence-to-Sequence回归。

恢复路径,使用路径函数。

路径(媒介);

Sequence-to-sequence回归,预测性维护

生理网2017年挑战

数据集的生理网2017年挑战[16]由一组的心电图记录采样在300赫兹,由一群专家分为四个不同的类:正常(N), AFib (a),其他节奏(O),和嘈杂的记录(~)。

下载并提取数据集使用的生理网2017年挑战ReadPhysionetData脚本,用于示例使用长短期记忆网络的ECG信号进行分类。

数据集是关于95 MB。根据您的网络连接,下载过程可能需要一些时间。

在媒介=目录(fullfile (matlabroot“例子”,“deeplearning_shared”,“主要”));ReadPhysionetData data =负载(“PhysionetData.mat”)信号= data.Signals;标签= data.Labels;

为一个例子,演示如何处理这些数据深度学习,明白了使用长短期记忆网络的ECG信号进行分类。

恢复路径,使用路径函数。

路径(媒介);

Sequence-to-label分类

田纳西伊士曼过程(TEP)模拟

这个数据集包括垫文件从田纳西伊士曼转换过程(TEP)模拟数据。

下载田纳西伊士曼过程(TEP)模拟数据集[15]从网站(见MathWorks支持文件金宝app免责声明)。数据集有四个组成部分:无故障的培训,绝对没错的测试,错误的训练,和错误的测试。每个文件单独下载。

数据集是关于1.7 GB。根据您的网络连接,下载过程可能需要一些时间。

url金宝appSupportFiles =“//www.tatmou.com/金宝appsupportfiles/predmaint”;url = url金宝appSupportFiles +“/ chemical-process-fault-detection-data / faultytesting.mat”;流(“下载TEP错误的测试数据(1 GB)……”)websave (“faultytesting.mat”url);流(“完成。\ n”url = urlSu金宝apppportFiles +“/ chemical-process-fault-detection-data / faultytraining.mat”;流(“TEP错误的训练数据下载(613 MB)……”)websave (“faultytraining.mat”url);流(“完成。\ n”url = urlSu金宝apppportFiles +“/ chemical-process-fault-detection-data / faultfreetesting.mat”;流(“下载TEP无故障的测试数据(69 MB)……”)websave (“faultfreetesting.mat”url);流(“完成。\ n”url = urlSu金宝apppportFiles +“/ chemical-process-fault-detection-data / faultfreetraining.mat”;流(“下载TEP无故障的训练数据(36 MB)……”)websave (“faultfreetraining.mat”url);流(“完成。\ n”)

下载的文件加载到MATLAB^®工作区。

负载(“faultfreetesting.mat”);负载(“faultfreetraining.mat”);负载(“faultytesting.mat”);负载(“faultytraining.mat”);

为一个例子,演示如何处理这些数据深度学习,明白了使用深度学习化工过程故障检测。

Sequence-to-label分类

生理网心电图分割

生理网心电图分类数据集[16][17]由大约15分钟共有105名患者的心电图记录。获得每个记录,审查员把两个电极放在不同的位置在一个病人的胸部,导致双通道信号。数据库提供了信号区域标签由一个自动生成专家系统。

生理网下载心电图细分的数据集https://github.com/mathworks/physionet_ECG_segmentation通过下载的ZIP文件QT_Database-master.zip。数据集是关于72 MB。根据您的网络连接,下载过程可能需要一些时间。集downloadFolder数据的位置。

downloadFolder = tempdir;url =“https://github.com/mathworks/physionet_ECG_segmentation/raw/master/QT_Database-master.zip”;文件名= fullfile (downloadFolder,“QT_Database-master.zip”);dataFolder = fullfile (downloadFolder,“QT_Database-master”);如果~存在(dataFolder“dir”)流(生理网”下载心电图分类数据集(72 MB)…”)websave(文件名,url);解压缩(文件名,downloadFolder);流(“完成。\ n”)结束

解创建文件夹QT_Database-master在你的临时目录中。这个文件夹包含的文本文件README.md和下列文件:

QTData.mat
Modified_physionet_data.txt
License.txt

QTData.mat包含生理网心电图细分数据。该文件Modified_physionet_data.txt提供了数据和源归因的描述操作应用到每个原始心电图记录。加载生理网垫心电图分割数据文件。

负载(fullfile (dataFolder“QTData.mat”))

为一个例子,演示如何处理这些数据深度学习,明白了波形分割使用深度学习。

Sequence-to-label分类、波形分割

合成行人、汽车和自行车反向散射

生成一个合成行人、汽车和自行车反向散射数据集使用辅助函数helperBackScatterSignals和helperDopplerSignatures使用的例子行人和自行车使用深度学习分类。

辅助函数helperBackScatterSignals生成指定数量的行人、骑自行车和汽车雷达的回报。对于每一个实现,返回信号维度N在- - - - - -N缓慢的,N快的数量夏令时间样品和N缓慢的数量标准时间样本。

辅助函数helperDopplerSignatures计算短时傅里叶变换)生成微多普勒雷达回波的签名。要获得微多普勒特征,使用辅助函数应用STFT和每个信号预处理方法。

在媒介=目录(fullfile (matlabroot“例子”,“分阶段”,“主要”));numPed = 1;%的行人数量实现numBic = 1;%的自行车数量实现numCar = 1;%的数量汽车实现[xPedRec, xBicRec xCarRec Tsamp] = helperBackScatterSignals (numPed, numBic numCar);(加速、T、F) = helperDopplerSignatures (xPedRec Tsamp);[SBic, ~, ~] = helperDopplerSignatures (xBicRec Tsamp);[伤疤,~,~]= helperDopplerSignatures (xCarRec Tsamp);

为一个例子,演示如何处理这些数据深度学习,明白了行人和自行车使用深度学习分类。

恢复路径,使用路径函数。

路径(媒介);

Sequence-to-label分类

生成的波形

生成矩形,线性调频、相位编码使用helper函数波形helperGenerateRadarWaveforms使用的例子雷达波形分类使用深度学习。

辅助函数helperGenerateRadarWaveforms产生3000信号的采样率为每个调制类型使用100 MHzphased.RectangularWaveform对于矩形脉冲,phased.LinearFMWaveform线性调频,phased.PhaseCodedWaveform相跟巴克码脉冲。

在媒介=目录(fullfile (matlabroot“例子”,“分阶段”,“主要”));[wav, modType] = helperGenerateRadarWaveforms;

为一个例子,演示如何处理这些数据深度学习,明白了雷达波形分类使用深度学习。

恢复路径,使用路径函数。

路径(媒介);

Sequence-to-label分类

视频数据集

数据描述任务

数据	描述	任务
HMDB:一个巨大的人类运动数据库 (代表)	HMBD51数据集包含7000年大约2 GB的视频数据片段51类,如喝,运行,俯卧撑。下载并提取HMBD51数据集HMDB:一个巨大的人类运动数据库。数据集2 GB。根据您的网络连接,下载过程可能需要一些时间。 RAR文件,解压缩之后的文件名称和标签视频使用helper函数`hmdb51Files`使用的例子分类使用深度学习视频。集`dataFolder`数据的位置。在媒介=目录(fullfile (matlabroot“例子”,“nnet”,“主要”));dataFolder = fullfile (tempdir,“hmdb51_org”);(文件、标签)= hmdb51Files (dataFolder); 为一个例子,演示如何处理这些数据深度学习,明白了分类使用深度学习视频。恢复路径,使用`路径`函数。路径(媒介);	视频分类

HMDB:一个巨大的人类运动数据库

(代表)

HMBD51数据集包含7000年大约2 GB的视频数据片段51类,如喝,运行,俯卧撑。

下载并提取HMBD51数据集HMDB:一个巨大的人类运动数据库。数据集2 GB。根据您的网络连接,下载过程可能需要一些时间。

RAR文件,解压缩之后的文件名称和标签视频使用helper函数hmdb51Files使用的例子分类使用深度学习视频。集dataFolder数据的位置。

在媒介=目录(fullfile (matlabroot“例子”,“nnet”,“主要”));dataFolder = fullfile (tempdir,“hmdb51_org”);(文件、标签)= hmdb51Files (dataFolder);

为一个例子,演示如何处理这些数据深度学习,明白了分类使用深度学习视频。

恢复路径,使用路径函数。

路径(媒介);

视频分类

文本数据集

数据描述任务

数据	描述	任务
工厂的报告	工厂报告数据集是一个表,它包含大约500报告的各种属性包括纯文本描述变量`描述`和一个分类标签变量`类别`。从文件读取工厂报告数据`“factoryReports.csv”`。提取的文本数据和标签`描述`和`类别`分别列。文件名=“factoryReports.csv”;data = readtable(文件名,“TextType”,“字符串”);textData = data.Description;标签= data.Category; 为一个例子,演示如何处理这些数据深度学习,明白了使用深度学习分类文本数据。	文本分类、主题建模
莎士比亚的十四行诗	该文件`sonnets.txt`包含所有莎士比亚的十四行诗在一个文本文件。读了莎士比亚的十四行诗的数据文件`“sonnets.txt”`。文件名=“sonnets.txt”;textData = fileread(文件名); 十四行诗是缩进两个空格字符和由两个换行符。消除压痕使用`取代`和文本分割成单独的十四行诗`分裂`。删除主标题的前三个元素和十四行诗的标题,它出现在每个十四行诗。 textData =取代(textData,”“,”“);textData =分裂(textData(换行换行));textData = textData(5:2:结束); 为一个例子,演示如何处理这些数据深度学习,明白了生成文本使用深度学习。	主题建模、文本生成
ArXiv的元数据	ArXiv API允许您访问科学发展的元数据提交https://arxiv.org包括抽象和主题领域。有关更多信息,请参见https://arxiv.org/help/api。导入一组抽象和分类标签从数学论文使用arXiV API。 url =“https://export.arxiv.org/oai2?verb=ListRecords”+…“集=数学”+…“&metadataPrefix = arXiv”;选择= weboptions (“超时”,160);代码= webread (url选项); 为例展示如何解析返回的XML代码和进口更多的记录,知道了使用深度学习Multilabel文本分类。	文本分类、主题建模
书从古登堡计划	你可以从古腾堡计划那里下载很多书。例如,下载文本从刘易斯·卡罗尔的《爱丽丝漫游奇境记》中https://www.gutenberg.org/files/11/11-h/11-h.htm使用`webread`函数。 url =“https://www.gutenberg.org/files/11/11-h/11-h.htm”;代码= webread (url); 里面的HTML代码包含相关的文本`< p >`(段落)元素。提取相关的文本通过解析HTML代码使用`htmlTree`函数,然后找到所有元素的元素名称`“p”`。树= htmlTree(代码);选择器=“p”;子树= findElement(树,选择器); 从HTML子树中提取文本数据使用`extractHTMLText`函数和删除空元素。 textData = extractHTMLText(子树);textData (textData = =”“)= []; 为一个例子,演示如何处理这些数据深度学习,明白了词词文本生成使用深度学习。	主题建模、文本生成
周末更新	该文件`weekendUpdates.xlsx`包含示例社交媒体状态更新包含标签“#周末”和“#假期”。这个数据集需要文本分析工具箱™。从文件中提取文本数据`weekendUpdates.xlsx`使用`readtable`功能和从变量中提取文本数据`TextData`。文件名=“weekendUpdates.xlsx”;台= readtable(文件名,“TextType”,“字符串”);textData = tbl.TextData; 对于一个例子,演示如何处理这些数据,看看在文本分析情绪(文本分析工具箱)。	情绪分析
罗马数字	CSV文件`“romanNumerals.csv”`包含小数1 - 1000在第一列和第二列对应的罗马数字。加载decimal-Roman数字双从CSV文件`“romanNumerals.csv”`。文件名= fullfile (“romanNumerals.csv”);选择= detectImportOptions(文件名,…“TextType”,“字符串”,…“ReadVariableNames”、假);选项。VariableNames = [“源”“目标”];选项。VariableTypes = [“字符串”“字符串”];data = readtable(文件名,选择); 为一个例子,演示如何处理这些数据深度学习,明白了Sequence-to-Sequence翻译使用注意。	Sequence-to-sequence翻译
财务报告	美国证券交易委员会(SEC)允许您访问财务报表通过电子数据收集、分析和检索(埃德加)API。有关更多信息,请参见https://www.sec.gov/edgar/searchedgar/accessing-edgar-data.htm。下载这些数据,使用该函数`financeReports`附加的例子生成特定领域情感词典(文本分析工具箱)作为支持文金宝app件。要访问这个函数,打开生活的脚本示例。年= 2019;季度= 4;最大长度= 2 e6;textData = financeReports(年、季度、最大长度); 对于一个例子,演示如何处理这些数据,看看生成特定领域情感词典(文本分析工具箱)。	情绪分析

工厂的报告

工厂报告数据集是一个表,它包含大约500报告的各种属性包括纯文本描述变量描述和一个分类标签变量类别。

从文件读取工厂报告数据“factoryReports.csv”。提取的文本数据和标签描述和类别分别列。

文件名=“factoryReports.csv”;data = readtable(文件名,“TextType”,“字符串”);textData = data.Description;标签= data.Category;

为一个例子,演示如何处理这些数据深度学习,明白了使用深度学习分类文本数据。

文本分类、主题建模

莎士比亚的十四行诗

该文件sonnets.txt包含所有莎士比亚的十四行诗在一个文本文件。

读了莎士比亚的十四行诗的数据文件“sonnets.txt”。

文件名=“sonnets.txt”;textData = fileread(文件名);

十四行诗是缩进两个空格字符和由两个换行符。消除压痕使用取代和文本分割成单独的十四行诗分裂。删除主标题的前三个元素和十四行诗的标题,它出现在每个十四行诗。

textData =取代(textData,”“,”“);textData =分裂(textData(换行换行));textData = textData(5:2:结束);

为一个例子,演示如何处理这些数据深度学习,明白了生成文本使用深度学习。

主题建模、文本生成

ArXiv的元数据

ArXiv API允许您访问科学发展的元数据提交https://arxiv.org包括抽象和主题领域。有关更多信息,请参见https://arxiv.org/help/api。

导入一组抽象和分类标签从数学论文使用arXiV API。

url =“https://export.arxiv.org/oai2?verb=ListRecords”+…“集=数学”+…“&metadataPrefix = arXiv”;选择= weboptions (“超时”,160);代码= webread (url选项);

为例展示如何解析返回的XML代码和进口更多的记录,知道了使用深度学习Multilabel文本分类。

文本分类、主题建模

书从古登堡计划

你可以从古腾堡计划那里下载很多书。例如,下载文本从刘易斯·卡罗尔的《爱丽丝漫游奇境记》中https://www.gutenberg.org/files/11/11-h/11-h.htm使用webread函数。

url =“https://www.gutenberg.org/files/11/11-h/11-h.htm”;代码= webread (url);

里面的HTML代码包含相关的文本< p >(段落)元素。提取相关的文本通过解析HTML代码使用htmlTree函数,然后找到所有元素的元素名称“p”。

树= htmlTree(代码);选择器=“p”;子树= findElement(树,选择器);

从HTML子树中提取文本数据使用extractHTMLText函数和删除空元素。

textData = extractHTMLText(子树);textData (textData = =”“)= [];

为一个例子,演示如何处理这些数据深度学习,明白了词词文本生成使用深度学习。

主题建模、文本生成

周末更新

该文件weekendUpdates.xlsx包含示例社交媒体状态更新包含标签“#周末”和“#假期”。这个数据集需要文本分析工具箱™。

从文件中提取文本数据weekendUpdates.xlsx使用readtable功能和从变量中提取文本数据TextData。

文件名=“weekendUpdates.xlsx”;台= readtable(文件名,“TextType”,“字符串”);textData = tbl.TextData;

对于一个例子,演示如何处理这些数据,看看在文本分析情绪(文本分析工具箱)。

情绪分析

罗马数字

CSV文件“romanNumerals.csv”包含小数1 - 1000在第一列和第二列对应的罗马数字。

加载decimal-Roman数字双从CSV文件“romanNumerals.csv”。

文件名= fullfile (“romanNumerals.csv”);选择= detectImportOptions(文件名,…“TextType”,“字符串”,…“ReadVariableNames”、假);选项。VariableNames = [“源”“目标”];选项。VariableTypes = [“字符串”“字符串”];data = readtable(文件名,选择);

为一个例子,演示如何处理这些数据深度学习,明白了Sequence-to-Sequence翻译使用注意。

Sequence-to-sequence翻译

财务报告

美国证券交易委员会(SEC)允许您访问财务报表通过电子数据收集、分析和检索(埃德加)API。有关更多信息,请参见https://www.sec.gov/edgar/searchedgar/accessing-edgar-data.htm。

下载这些数据,使用该函数financeReports附加的例子生成特定领域情感词典(文本分析工具箱)作为支持文金宝app件。要访问这个函数,打开生活的脚本示例。

年= 2019;季度= 4;最大长度= 2 e6;textData = financeReports(年、季度、最大长度);

对于一个例子,演示如何处理这些数据,看看生成特定领域情感词典(文本分析工具箱)。

情绪分析

音频数据集

数据描述任务

数据	描述	任务
语音命令	语音命令数据集[18]由大约65000个音频文件包括标有1的12类是的,没有,在,从,以及类对应于未知的命令和背景噪音。下载并提取语音命令数据集https://storage.googleapis.com/download.tensorflow.org/data/speech_commands_v0.01.tar.gz。数据集是关于1.4 GB。根据您的网络连接,下载过程可能需要一些时间。集`dataFolder`数据的位置。使用`audioDatastore`创建一个数据存储包含文件名和相应的标签。 dataFolder = tempdir;广告= audioDatastore (dataFolder,…“IncludeSubfolders”,真的,…“FileExtensions”,“wav”,…“LabelSource”,“foldernames”); 为一个例子,演示如何处理这些数据深度学习,明白了语音命令识别使用深度学习。	音频分类、语音识别
Mozilla共同的声音	Mozilla常见语音数据集由录音讲话和对应的文本文件。数据还包括人口统计元数据,比如年龄、性别、和口音。下载并提取Mozilla常见语音数据集的数据集https://voice.mozilla.org/。是一个开放的数据集的数据集,这意味着它能随着时间的推移而增长。截至2019年10月,数据集是关于28 GB。根据您的网络连接,下载过程可能需要一些时间。集`dataFolder`数据的位置。使用`audioDatastore`创建一个数据存储包含文件名和相应的标签。 dataFolder = tempdir;广告= audioDatastore (fullfile (dataFolder,“剪辑”)); 为一个例子,演示如何处理这些数据深度学习,明白了性别使用LSTM网络进行分类。	音频分类、语音识别。
免费使用数字数据集	免费使用数字数据集,2000年1月29日,2019年,由获得的英语数字0到9的录音从四个扬声器。两个扬声器的这个版本是美国英语和母语的非本地的两个喇叭扬声器分别与比利时法国和德国口音的英语。数据采样在8000赫兹。下载免费使用数字数据集(FSDD)录音https://github.com/Jakobovski/free-spoken-digit-dataset。集`dataFolder`数据的位置。使用`audioDatastore`创建一个数据存储包含文件名和相应的标签。 dataFolder = fullfile (tempdir,“free-spoken-digit-dataset”,“录音”);广告= audioDatastore (dataFolder); 为一个例子,演示如何处理这些数据深度学习,明白了语音数字识别与小波散射和深度学习。	音频分类、语音识别。
柏林的情感语音数据库	柏林的情感语音数据库[19]包含535个口语话语10演员旨在传达的情绪:愤怒、无聊、厌恶、焦虑、恐惧、快乐、悲伤、或中性。情感是文本无关的。文件名称代码指示演讲者ID、文本语言,情感,和版本。解释代码的网站包含一个关键和关于扬声器的附加信息,如性别和年龄。下载柏林的情感语音数据库http://emodb.bilderbar.info/index - 1280. - html。数据集是大约40 MB。根据您的网络连接,下载过程可能需要一些时间。集`dataFolder`数据的位置。使用`audioDatastore`创建一个数据存储包含文件名和相应的标签。 dataFolder = tempdir;广告= audioDatastore (fullfile (dataFolder,“wav”)); 为一个例子,演示如何处理这些数据深度学习,明白了语音情感识别。	音频分类、语音识别。
图坦卡蒙声场景2017	下载并提取图坦卡蒙声场景2017数据集[20]从图坦卡蒙声场景2017年,开发数据集和2017年图坦卡蒙声场景,评估数据集。数据集由十秒从15个声场景包括音频片段公共汽车,车,图书馆。为一个例子,演示如何处理这些数据深度学习,明白了声场景识别使用后期融合。	声场景分类

语音命令

语音命令数据集[18]由大约65000个音频文件包括标有1的12类是的,没有,在,从,以及类对应于未知的命令和背景噪音。

下载并提取语音命令数据集https://storage.googleapis.com/download.tensorflow.org/data/speech_commands_v0.01.tar.gz。数据集是关于1.4 GB。根据您的网络连接,下载过程可能需要一些时间。

集dataFolder数据的位置。使用audioDatastore创建一个数据存储包含文件名和相应的标签。

dataFolder = tempdir;广告= audioDatastore (dataFolder,…“IncludeSubfolders”,真的,…“FileExtensions”,“wav”,…“LabelSource”,“foldernames”);

为一个例子,演示如何处理这些数据深度学习,明白了语音命令识别使用深度学习。

音频分类、语音识别

Mozilla共同的声音

Mozilla常见语音数据集由录音讲话和对应的文本文件。数据还包括人口统计元数据,比如年龄、性别、和口音。

下载并提取Mozilla常见语音数据集的数据集https://voice.mozilla.org/。是一个开放的数据集的数据集,这意味着它能随着时间的推移而增长。截至2019年10月,数据集是关于28 GB。根据您的网络连接,下载过程可能需要一些时间。集dataFolder数据的位置。使用audioDatastore创建一个数据存储包含文件名和相应的标签。

dataFolder = tempdir;广告= audioDatastore (fullfile (dataFolder,“剪辑”));

为一个例子,演示如何处理这些数据深度学习,明白了性别使用LSTM网络进行分类。

音频分类、语音识别。

免费使用数字数据集

免费使用数字数据集,2000年1月29日,2019年,由获得的英语数字0到9的录音从四个扬声器。两个扬声器的这个版本是美国英语和母语的非本地的两个喇叭扬声器分别与比利时法国和德国口音的英语。数据采样在8000赫兹。

下载免费使用数字数据集(FSDD)录音https://github.com/Jakobovski/free-spoken-digit-dataset。

集dataFolder数据的位置。使用audioDatastore创建一个数据存储包含文件名和相应的标签。

dataFolder = fullfile (tempdir,“free-spoken-digit-dataset”,“录音”);广告= audioDatastore (dataFolder);

为一个例子,演示如何处理这些数据深度学习,明白了语音数字识别与小波散射和深度学习。

音频分类、语音识别。

柏林的情感语音数据库

柏林的情感语音数据库[19]包含535个口语话语10演员旨在传达的情绪:愤怒、无聊、厌恶、焦虑、恐惧、快乐、悲伤、或中性。情感是文本无关的。

文件名称代码指示演讲者ID、文本语言,情感,和版本。解释代码的网站包含一个关键和关于扬声器的附加信息,如性别和年龄。

下载柏林的情感语音数据库http://emodb.bilderbar.info/index - 1280. - html。数据集是大约40 MB。根据您的网络连接,下载过程可能需要一些时间。

集dataFolder数据的位置。使用audioDatastore创建一个数据存储包含文件名和相应的标签。

dataFolder = tempdir;广告= audioDatastore (fullfile (dataFolder,“wav”));

为一个例子,演示如何处理这些数据深度学习,明白了语音情感识别。

音频分类、语音识别。

图坦卡蒙声场景2017

下载并提取图坦卡蒙声场景2017数据集[20]从图坦卡蒙声场景2017年,开发数据集和2017年图坦卡蒙声场景,评估数据集。

数据集由十秒从15个声场景包括音频片段公共汽车,车,图书馆。

为一个例子,演示如何处理这些数据深度学习,明白了声场景识别使用后期融合。

声场景分类

引用

Mesaros Annamaria,托尼Heittola,和图维尔塔宁。“声场景分类:概述DCASE 2017条目的挑战。”Proceedings of the International Workshop on Acoustic Signal Enhancement (2018):

411 - 415。

[1]湖,Brenden M。,Ruslan Salakhutdinov, and Joshua B. Tenenbaum. “Human-Level Concept Learning through Probabilistic Program Induction.”科学350年,没有。6266(2015年12月11日):1332 - 38。https://doi.org/10.1126/science.aab3050。

[2]TensorFlow团队。“花”https://www.tensorflow.org/datasets/catalog/tf_flowers

[3]Kat,郁金香、图像、https://www.flickr.com/photos/swimparallel/3455026124。Creative Commons许可(CC)。

Rob Bertholf [4]向日葵、图像、https://www.flickr.com/photos/robbertholf/20777358950。Creative Commons 2.0通用许可证。

[5]帕文,玫瑰、图像、https://www.flickr.com/photos/55948751@N00。Creative Commons 2.0通用许可证。

[6]约翰·海斯蓝蒲公英、图像、https://www.flickr.com/photos/foxypar4/645330051。Creative Commons 2.0通用许可证。

[7]Krizhevsky,亚历克斯。“学习的多层功能从微小的图像。”MSc thesis, University of Toronto, 2009.- 2009 tr.pdf https://www.cs.toronto.edu/%7ekriz/learning特性。

加布里埃尔·[8]Brostow J。,Julien Fauqueur, and Roberto Cipolla. “Semantic Object Classes in Video: A High-Definition Ground Truth Database.”模式识别的字母30日,没有。2(2009年1月):88 - 97。https://doi.org/10.1016/j.patrec.2008.04.005

[9]Kemker、罗纳德·卡尔Salvaggio,克里斯托弗Kanan。“高分辨率多光谱数据集语义分割。”ArXiv: 1703.01918 (Cs),2017年3月6日。https://arxiv.org/abs/1703.01918

[10]Isensee,费边,菲利普Kickingereder,沃尔夫冈•维克马丁Bendszus,克劳斯·h·Maier-Hein。“大脑肿瘤分割和Radiomics生存预测:2017年贡献的后代的挑战。“在Brainlesion:神经胶质瘤、多发性硬化、中风和创伤性脑损伤、编辑亚历桑德罗·Crimi Spyridon巴卡,Hugo Kuijf Bjoern Menze, Mauricio雷耶斯,10670:287 - 97。瑞士Cham:施普林格国际出版,2018年。https://doi.org/10.1007/978 - 3 - 319 - 75238 - 9 _25

[11]Ehteshami Bejnordi、Babak Mitko高山病,保罗•约翰内斯·范·迪斯特布拉姆·范·Ginneken尼科Karssemeijer, Geert Litjens,珀斯a·w·m·范德Laak et al。”诊断评估深度学习算法的检测在乳腺癌患者淋巴结转移。”《美国医学会杂志》318年,没有。22日(2017年12月12日):2199。https://doi.org/10.1001/jama.2017.14585

[12]奖赏,Mineichi,小君富山,学者Shimbo。“多维曲线分类使用通过区域。“模式识别字母20,不。11 - 13日(1999年11月):1103 - 11所示。https://doi.org/10.1016/s0167 - 8655 (99) 00077 - x

[13]奖赏,Mineichi,小君富山,学者Shimbo。日本元音数据集。通过UCI机器学习库分布。https://archive.ics.uci.edu/ml/datasets/Japanese +元音

[14]Saxena,阿凯Goebel。“涡扇发动机退化仿真数据集。”NASA艾姆斯预测数据存储库https://ti.arc.nasa.gov/tech/dash/groups/pcoe/prognostic-data-repository/NASA艾姆斯研究中心,莫菲特场,CA

[15]Rieth,科里。,Ben D. Amsel, Randy Tran, and Maia B. Cook. "Additional Tennessee Eastman Process Simulation Data for Anomaly Detection Evaluation."哈佛Dataverse,2017年第1版。https://doi.org/10.7910/DVN/6C3JR1。

[16]不氩L。,Luis A. N. Amaral, Leon Glass, Jeffery M. Hausdorff, Plamen Ch. Ivanov, Roger G. Mark, Joseph E. Mietus, George B. Moody, Chung-Kang Peng, and H. Eugene Stanley. "PhysioBank, PhysioToolkit, and PhysioNet: Components of a New Research Resource for Complex Physiologic Signals."循环101年,23号,2000,pp. e215-e220。https://circ.ahajournals.org/content/101/23/e215.full

[17]拉古纳,巴勃罗,罗杰·g·马克,必要l . Goldberger和乔治·b·穆迪。“数据库评估算法测量心电图QT间隔和其他波形的。”计算机在心脏病学24日,1997年,页673 - 676。

[18]监狱长P。“语音命令:一个公共数据集单字原图语音识别”,2017。可以从http://download.tensorflow.org/data/speech_commands_v0.01.tar.gz。版权2017年谷歌。语音命令数据集是创作共用署名4.0许可下的,可用:https://creativecommons.org/licenses/by/4.0/legalcode。

[19]Burkhardt,费利克斯,阿斯特丽德Paeschke,梅丽莎·a .创建人沃尔特·f·Sendlmeier Weiss和便雅悯。“德国情感语音数据库。”Interspeech学报》2005。葡萄牙里斯本:国际言语交际协会,2005。

[20]Mesaros Annamaria,托尼Heittola,和图维尔塔宁。“声场景分类:概述DCASE 2017条目的挑战。”在2018年16日国际研讨会声学信号增强(IWAENC),411 - 415页。IEEE 2018。

另请参阅

trainingOptions|trainNetwork