文档帮助中心
使用这些数据集与深度学习应用程序开始。
数字
10000年的数字数据集由合成手写数字灰度图像。28-by-28每个图像像素和有关联的标签表示数字图像代表(0 - 9)。每个图像一直旋转一定的角度。当加载图像阵列,您还可以加载图像的旋转角度。
数字数据加载内存数值数组使用digitTrain4DArrayData和digitTest4DArrayData功能。
digitTrain4DArrayData
digitTest4DArrayData
[XTrain, YTrain anglesTrain] = digitTrain4DArrayData;[XTest,欧美,anglesTest] = digitTest4DArrayData;
示例显示了如何处理这些数据的深度学习,明白了监测深度学习培训的进展和火车卷积神经网络回归。
数字数据加载图像数据存储使用imageDatastore功能和指定包含图像数据的文件夹。
imageDatastore
dataFolder = fullfile (toolboxdir (“nnet”),“nndemos”,“nndatasets”,“DigitDataset”);imd = imageDatastore (dataFolder,…“IncludeSubfolders”,真的,…。“LabelSource”,“foldernames”);
为一个例子,演示如何处理这些数据深度学习,明白了创建简单的深度学习网络分类。
MNIST
(代表)
MNIST数据集包含70000份手写数字分成训练集和测试分区60000年和10000年的图像,分别。28-by-28每个图像像素和有关联的标签表示数字图像代表(0 - 9)。
下载MNIST文件http://yann.lecun.com/exdb/mnist/和负载数据集到工作区中。加载的数据文件,MATLAB数组,提取,并将工作目录中的文件,然后使用helper函数processImagesMNIST和processLabelsMNIST使用的例子火车变分Autoencoder (VAE)来生成图像。
processImagesMNIST
processLabelsMNIST
在媒介=目录(fullfile (matlabroot“例子”,“nnet”,“主要”));filenameImagesTrain =“train-images.idx3-ubyte”;filenameLabelsTrain =“train-labels.idx1-ubyte”;filenameImagesTest =“t10k-images.idx3-ubyte”;filenameLabelsTest =“t10k-labels.idx1-ubyte”;XTrain = processImagesMNIST (filenameImagesTrain);YTrain = processLabelsMNIST (filenameLabelsTrain);XTest = processImagesMNIST (filenameImagesTest);欧美= processLabelsMNIST (filenameLabelsTest);
为一个例子,演示如何处理这些数据深度学习,明白了火车变分Autoencoder (VAE)来生成图像。
恢复路径,使用路径函数。
路径
路径(媒介);
Omniglot
Omniglot数据集包含50个字母的字符集,分为30集培训和20集进行测试。每个字母都包含一个字符数,从14 Ojibwe(加拿大原住民音节)曾到55。最后,每个角色都有20个手写的观察。
下载并提取Omniglot数据集[1]从https://github.com/brendenlake/omniglot。集downloadFolder数据的位置。
downloadFolder
downloadFolder = tempdir;url =“https://github.com/brendenlake/omniglot/raw/master/python”;urlTrain = url +“/ images_background.zip”;urlTest = url +“/ images_evaluation.zip”;filenameTrain = fullfile (downloadFolder,“images_background.zip”);filenameTest = fullfile (downloadFolder,“images_evaluation.zip”);dataFolderTrain = fullfile (downloadFolder,“images_background”);dataFolderTest = fullfile (downloadFolder,“images_evaluation”);如果~存在(dataFolderTrain“dir”)流(“下载Omniglot训练数据集(4.5 MB)…”)websave (filenameTrain urlTrain);解压缩(filenameTrain downloadFolder);流(“完成。\ n”)结束如果~存在(dataFolderTest“dir”)流(“下载Omniglot测试数据(3.2 MB)…”)websave (filenameTest urlTest);解压缩(filenameTest downloadFolder);流(“完成。\ n”)结束
负荷训练和测试数据的图像数据存储,使用imageDatastore函数。手动指定标签从文件中提取标签名称和设置标签财产。
标签
imdsTrain = imageDatastore (dataFolderTrain,…“IncludeSubfolders”,真的,…“LabelSource”,“没有”);文件= imdsTrain.Files;部分=分裂(文件、filesep);标签=加入(部分(:,(end-2): (end-1)),“_”);imdsTrain。标签= categorical(labels); imdsTest = imageDatastore(dataFolderTest,…“IncludeSubfolders”,真的,…“LabelSource”,“没有”);文件= imdsTest.Files;部分=分裂(文件、filesep);标签=加入(部分(:,(end-2): (end-1)),“_”);imdsTest。标签= categorical(labels);
为一个例子,演示如何处理这些数据深度学习,明白了火车暹罗网络比较图像。
花
图片致谢:[3][4][5][6]
花的花朵数据集包含3670张图片属于五类(黛西,蒲公英,玫瑰,向日葵,郁金香)。
下载并提取花数据集[2]从http://download.tensorflow.org/example_images/flower_photos.tgz。数据集是关于218 MB。根据您的网络连接,下载过程可能需要一些时间。集downloadFolder数据的位置。
url =“http://download.tensorflow.org/example_images/flower_photos.tgz”;downloadFolder = tempdir;文件名= fullfile (downloadFolder,“flower_dataset.tgz”);dataFolder = fullfile (downloadFolder,“flower_photos”);如果~存在(dataFolder“dir”)流(“花下载数据集(218 MB)…”)websave(文件名,url);解压(文件名,downloadFolder)流(“完成。\ n”)结束
加载数据作为一个图像数据存储使用imageDatastore功能和指定包含图像数据的文件夹。
imd = imageDatastore (dataFolder,…“IncludeSubfolders”,真的,…“LabelSource”,“foldernames”);
为一个例子,演示如何处理这些数据深度学习,明白了火车生成对抗网络(甘)。
例如食物图片
食物的例子图像数据集包含978年9类食物的照片(ceaser_salad,caprese_salad,french_fries,greek_salad,汉堡,hot_dog,披萨,生鱼片,寿司)。
下载并解压示例食物图像数据集//www.tatmou.com/金宝appsupportfiles/nnet/data/ExampleFoodImageDataset.zip。这个数据集是关于77 MB。根据您的网络连接,下载过程可能需要一些时间。集downloadFolder数据的位置。
url =“//www.tatmou.com/金宝appsupportfiles/nnet/data/ExampleFoodImageDataset.zip”;downloadFolder = tempdir;文件名= fullfile (downloadFolder,“ExampleFoodImageDataset.zip”);dataFolder = fullfile (downloadFolder,“ExampleFoodImageDataset”);如果~存在(dataFolder“dir”)流(“下载示例食物图像数据集(77 MB)……”)websave(文件名,url);解压缩(文件名,downloadFolder);流(“完成。\ n”)结束
为一个例子,演示如何处理这些数据深度学习,明白了视图使用tsne网络行为。
CIFAR-10
CIFAR-10数据集包含60000彩色图像的大小32-by-32像素,属于10类(飞机,汽车,鸟,猫,鹿,狗,青蛙,马,船,卡车)。
有6000个图像每个类和数据集分为训练集50000张图片和10000张照片的测试集。该数据集是一种最广泛使用的数据集进行测试的新图像分类模型。
下载并提取CIFAR-10数据集[7]从https://www.cs.toronto.edu/%7Ekriz/cifar-10-matlab.tar.gz。数据集是关于175 MB。根据您的网络连接,下载过程可能需要一些时间。集downloadFolder数据的位置。
url =“https://www.cs.toronto.edu/ ~ kriz / cifar-10-matlab.tar.gz”;downloadFolder = tempdir;文件名= fullfile (downloadFolder,“cifar-10-matlab.tar.gz”);dataFolder = fullfile (downloadFolder,“cifar-10-batches-mat”);如果~存在(dataFolder“dir”)流(“下载CIFAR-10数据集(175 MB)…”);websave(文件名、url);解压(文件名,downloadFolder);流(“完成。\ n”)结束
loadCIFARData
在媒介=目录(fullfile (matlabroot“例子”,“nnet”,“主要”));[XTrain, YTrain XValidation YValidation] = loadCIFARData (downloadFolder);
为一个例子,演示如何处理这些数据深度学习,明白了火车残余网络图像分类。
MathWorks®营销上
这是一个小数据集包含75的图像MathWorks商品,属于五个不同的类(帽,多维数据集,打牌,螺丝刀,火炬)。您可以使用此数据集尝试转移迅速学习和图像分类。
大小的图像是227 - 227 - 3。
提取MathWorks营销数据集。
文件名=“MerchData.zip”;dataFolder = fullfile (tempdir,“MerchData”);如果~存在(dataFolder“dir”解压缩(文件名,tempdir);结束
imd = imageDatastore (dataFolder,…“IncludeSubfolders”,真的,…。“LabelSource”,“foldernames”);
示例显示了如何处理这些数据的深度学习,明白了学习开始转移和火车深入学习网络对新图像进行分类。
CamVid
CamVid数据集是一组图像包含街道视图获得汽车驱动。数据集是用于训练网络执行的语义分割图像和提供了32进行像素级标签语义类,包括车,行人,路。
大小的图像是720 - 960 - 3。
下载并提取CamVid数据集[8]从http://web4.cs.ucl.ac.uk/staff/g.brostow/MotionSegRecData。数据集是关于573 MB。根据您的网络连接,下载过程可能需要一些时间。集downloadFolder数据的位置。
downloadFolder = tempdir;url =“http://web4.cs.ucl.ac.uk/staff/g.brostow/MotionSegRecData”urlImages = url +“/文件/ 701 _stillsraw_full.zip”;urlLabels = url +“/数据/ LabeledApproved_full.zip”;dataFolder = fullfile (downloadFolder,“CamVid”);dataFolderImages = fullfile (dataFolder,“图片”);dataFolderLabels = fullfile (dataFolder,“标签”);filenameLabels = fullfile (dataFolder,“labels.zip”);filenameImages = fullfile (dataFolder,“images.zip”);如果~存在(filenameLabels“文件”)| | ~存在(imagesZip“文件”mkdir (dataFolder)流(“下载CamVid图像数据集(557 MB)…”);websave (filenameImages urlImages);解压缩(filenameImages dataFolderImages);流(“完成。\ n”)流(“下载CamVid数据集标签(16 MB)…”);websave (filenameLabels urlLabels);解压缩(filenameLabels dataFolderLabels);流(“完成。\ n”)结束
加载数据作为一个像素标签数据存储使用pixelLabelDatastore函数包含标签数据,并指定文件夹类,标签id。使训练更容易,组32原始类数据集到11类。标签标识,使用helper函数camvidPixelLabelIDs使用的例子语义分割使用深度学习。
pixelLabelDatastore
camvidPixelLabelIDs
在媒介=目录(fullfile (matlabroot“例子”,“deeplearning_shared”,“主要”));imd = imageDatastore (dataFolderImages,“IncludeSubfolders”,真正的);类= [“天空”“建筑”“极”“路”“路面”“树”…“SignSymbol”“篱笆”“汽车”“行人”“自行车”];labelIDs = camvidPixelLabelIDs;pxds = pixelLabelDatastore (dataFolderLabels、类labelIDs);
为一个例子,演示如何处理这些数据深度学习,明白了语义分割使用深度学习。
车辆
295年的车辆数据集由图像包含一个或两个标记的实例。这个小数据集用于探索YOLO-v2训练过程,但在实践中,需要更多的标签图片来训练一个健壮的探测器。
提取车辆数据集。dataFolder数据的位置。
dataFolder
文件名=“vehicleDatasetImages.zip”;dataFolder = fullfile (tempdir,“vehicleImages”);如果~存在(dataFolder“dir”解压缩(文件名,tempdir);结束
负载作为一个表的数据集提取文件名和边界框的垫文件和文件名转换为绝对的文件路径。
data =负载(“vehicleDatasetGroundTruth.mat”);vehicleDataset = data.vehicleDataset;vehicleDataset。imageFilename = fullfile (tempdir vehicleDataset.imageFilename);
创建一个图像数据存储包含图片和一盒标签包含边界框使用的数据存储imageDatastore和boxLabelDatastore函数,分别。结合生成的数据存储使用结合函数。
boxLabelDatastore
结合
filenamesImages = vehicleDataset.imageFilename;tblBoxes = vehicleDataset (:,“汽车”);imd = imageDatastore (filenamesImages);建筑物= boxLabelDatastore (tblBoxes);cd =结合(imd,建筑物);
为一个例子,演示如何处理这些数据深度学习,明白了对象检测使用YOLO v2意思深入学习。
RIT-18
RIT-18数据集包含了图像数据被一架无人机在哈姆林海滩州立公园,在纽约州。数据包含标签的训练、验证和测试集,包括18个对象类标签路标,树,建筑。
下载RIT-18数据集[9]从https://www.cis.rit.edu/%7Ermk6217/rit18_data.mat。数据集是关于3 GB。根据您的网络连接,下载过程可能需要一些时间。集downloadFolder数据的位置。
downloadFolder = tempdir;url =“http://www.cis.rit.edu/ ~ rmk6217 / rit18_data.mat”;文件名= fullfile (downloadFolder,“rit18_data.mat”);如果~存在(文件名,“文件”)流(“下载哈姆林海滩的数据集(3 GB)…”);websave(文件名、url);流(“完成。\ n”)结束
为一个例子,演示如何处理这些数据深度学习,明白了多光谱图像的语义分割使用深度学习。
有钱的孩子
小鬼数据集包含了脑部肿瘤的MRI扫描,即神经胶质瘤,这是最常见的原发性脑恶性肿瘤。
数据集包含750个4 - d卷,每个代表一个堆栈的3 d图像。每个4 d体积大小240 - - 240 - 155 - 4,在前三个维度对应高度,宽度和深度的三维体积的形象。第四维对应于不同的扫描方式。484数据集分为训练与体元标签和266个测试卷卷。
创建一个目录来存储小鬼数据集[10]。
dataFolder = fullfile (tempdir,“小鬼”);如果~存在(dataFolder“dir”mkdir (dataFolder);结束
下载的小鬼数据医学分割十项全能通过单击“下载数据”链接。下载“Task01_BrainTumour。焦油”文件。数据集是关于7 GB。根据您的网络连接,下载过程可能需要一些时间。
TAR文件提取到指定的目录dataFolder变量。那么,如果提取成功dataFolder包含一个目录命名Task01_BrainTumour这有三个子目录:imagesTr,imagesTs,labelsTr。
Task01_BrainTumour
imagesTr
imagesTs
labelsTr
为一个例子,演示如何处理这些数据深度学习,明白了三维大脑肿瘤分割使用深度学习。
Camelyon16
Camelyon16挑战的数据包含400 WSIs淋巴结从两个独立的来源,分为270 130训练图像和测试图像。气管无名动脉瘘管的WSIs被存储为文件剥夺格式11-level金字塔结构。
159年的训练数据集由WSIs正常淋巴结和111张幻灯片的图片(WSIs)淋巴结的肿瘤组织和健康组织。通常,肿瘤组织的一小部分健康的组织。地面实况病变边界伴随肿瘤图像的坐标。
创建目录来存储Camelyon16数据集[11]。
dataFolderTrain = fullfile (tempdir,“Camelyon16”,“培训”);dataFolderNormalTrain = fullfile (dataFolderTrain,“正常”);dataFolderTumorTrain = fullfile (dataFolderTrain,“肿瘤”);dataFolderAnnotationsTrain = fullfile (dataFolderTrain,“lesion_annotations”);如果~存在(dataFolderTrain“dir”mkdir (dataFolderTrain);mkdir (dataFolderNormalTrain);mkdir (dataFolderTumorTrain);mkdir (dataFolderAnnotationsTrain);结束
下载Camelyon16数据集Camelyon17点击第一个“CAMELYON16数据集”链接。打开“培训”目录中,然后按照以下步骤:
下载“lesion_annotations。邮政”文件。提取文件到指定的目录dataFolderAnnotationsTrain变量。
dataFolderAnnotationsTrain
打开“正常”的目录。图片下载到指定的目录dataFolderNormalTrain变量。
dataFolderNormalTrain
打开“肿瘤”目录。图片下载到指定的目录dataFolderTumorTrain变量。
dataFolderTumorTrain
数据集2 GB。根据您的网络连接,下载过程可能需要一些时间。
为一个例子,演示如何处理这些数据深度学习,明白了深度学习分类的大型多分辨率图像。
常见的对象上下文(可可)
可可2014训练图像数据集包含82783张图片。注释数据包含至少五个标题对应每个图像。
创建目录来存储可可数据集。
dataFolder = fullfile (tempdir,“可可”);如果~存在(dataFolder“dir”mkdir (dataFolder);结束
下载并提取可可2014训练图像和字幕https://cocodataset.org/下载通过单击“2014训练图像”和“2014火车/ Val注释”链接,分别。数据保存在指定的文件夹dataFolder。
从文件中提取标题captions_train2014.json使用jsondecode函数。
captions_train2014.json
jsondecode
文件名= fullfile (dataFolder,“annotations_trainval2014”,“注释”,…“captions_train2014.json”);str = fileread(文件名);data = jsondecode (str);
的注释结构的字段包含图像字幕所需的数据。
注释
为一个例子,演示如何处理这些数据深度学习,明白了图像字幕使用注意。
IAPR TC-12
的IAPR TC-12基准由20000名仍然自然图像。数据集包括照片的人、动物、城市、和更多。数据文件的大小大约是1.8 GB。
下载IAPR TC-12数据集。
dataDir = fullfile (tempdir,“iaprtc12”);url =“http://www-i6.informatik.rwth-aachen.de/imageclef/resources/iaprtc12.tgz”;如果~存在(dataDir“dir”)流(“下载IAPR TC-12数据集(1.8 GB)…\ n ');试一试解压(url, dataDir);抓%在一些Windows机器上,将命令解压错误. tgz%的文件。重命名.tg并再试一次。文件名= fullfile (tempdir,“iaprtc12.tg”);websave(文件名、url);解压(文件名,dataDir);结束流(“做。\ n \ n”);结束
加载数据作为一个图像数据存储使用imageDatastore函数。指定包含图像数据的文件夹和文件扩展名。
imageDir = fullfile (dataDir,“图片”)ext = {“jpg”,bmp格式的,“使用”};imd = imageDatastore (imageDir,…“IncludeSubfolders”,真的,…“FileExtensions”ext);
为一个例子,演示如何处理这些数据深度学习,明白了单一图像超分辨率使用深度学习。
苏黎世原始RGB
苏黎世原始RGB数据集包含48043注册对原始和RGB空间训练图像补丁的大小448 - - 448。数据集包含两个单独的测试集。一个测试集由1204空间注册对原始和RGB图像补丁的大小448 - - 448。未登记的全分辨率的其他测试集由原始和RGB图像。数据集的大小是22 GB。
创建一个目录来存储数据集。
imageDir = fullfile (tempdir,“ZurichRAWToRGB”);如果~存在(imageDir“dir”mkdir (imageDir);结束
imageDir
full_resolution
测试
火车
为一个例子,演示如何处理这些数据深度学习,明白了使用深度学习开发原始相机处理管道。
日本的元音
日本元音数据集[12][13]包含预处理序列代表日本元音的话语从不同的扬声器。
XTrain和XTest细胞阵列包含维度12可变长度的序列。YTrain和欧美是分类向量的标签1到9,对应于九个扬声器。的条目XTrain与12矩阵行(每个特性的一行)和不同数量的列(每个时间步一列)。XTest是一个单元阵列包含370维度12可变长度的序列。
XTrain
XTest
YTrain
欧美
日本元音数据加载设置为内存单元数组包含数字序列使用japaneseVowelsTrainData和japaneseVowelsTestData功能。
japaneseVowelsTrainData
japaneseVowelsTestData
[XTrain, YTrain] = japaneseVowelsTrainData;[XTest,欧美]= japaneseVowelsTestData;
为一个例子,演示如何处理这些数据深度学习,明白了使用深度学习序列分类。
水痘
水痘数据集包含一个时间序列,随着时间的推移步骤对应月和值对应于病例数量。输出是一个单元阵列,其中每个元素是一个时间步。
加载水痘数据为一个单一的数字序列使用chickenpox_dataset函数。重塑一个行向量数据。
chickenpox_dataset
数据= chickenpox_dataset;数据=({}):数据;
为一个例子,演示如何处理这些数据深度学习,明白了使用深度学习时间序列预测。
人类活动
人类活动数据集包含7个传感器数据的时间序列来自智能手机戴在身体。每个序列有三个特性和不同长度。这三个特征对应于加速度计读数在三个不同的方向。
载入人类活动数据集。
dataTrain =负载(“HumanActivityTrain”);人数(=负载(“HumanActivityTest”);XTrain = dataTrain.XTrain;YTrain = dataTrain.YTrain;XTest = dataTest.XTest;欧美= dataTest.YTest;
为一个例子,演示如何处理这些数据深度学习,明白了使用深度学习Sequence-to-Sequence分类。
涡扇发动机退化模拟
涡扇发动机的每个时间序列退化模拟数据集[14]代表一个不同的引擎。每个引擎从开始未知程度的磨损和制造变化。引擎操作通常在每个时间序列的开始,并开发一个错误在某种程度上在系列。在训练集,断层生长在级到系统故障。
数据包含一个zip压缩文本文件与26列的数字,用空格分开。每一行是一个快照的数据在一个运行周期,每一列是一个不同的变量。列对应如下:
列1 -单元号
列2 -时间周期
列3 - 5——操作设置
列6-26——传感器测量1日到21日
创建一个目录来存储涡扇发动机退化模拟数据集。
dataFolder = fullfile (tempdir,“涡扇”);如果~存在(dataFolder“dir”mkdir (dataFolder);结束
下载并提取的涡扇发动机退化模拟数据集https://ti.arc.nasa.gov/tech/dash/groups/pcoe/prognostic-data-repository/。
解压缩的数据文件CMAPSSData.zip。
CMAPSSData.zip
文件名=“CMAPSSData.zip”;解压缩(文件名,dataFolder)
负荷训练和测试数据使用辅助函数processTurboFanDataTrain和processTurboFanDataTest,分别。使用这些函数的例子使用深度学习Sequence-to-Sequence回归。
processTurboFanDataTrain
processTurboFanDataTest
在媒介=目录(fullfile (matlabroot“例子”,“nnet”,“主要”));filenamePredictors = fullfile (dataFolder,“train_FD001.txt”);[XTrain, YTrain] = processTurboFanDataTrain (filenamePredictors);filenamePredictors = fullfile (dataFolder,“test_FD001.txt”);filenameResponses = fullfile (dataFolder,“RUL_FD001.txt”);[XTest,欧美]= processTurboFanDataTest (filenamePredictors filenameResponses);
为一个例子,演示如何处理这些数据深度学习,明白了使用深度学习Sequence-to-Sequence回归。
生理网2017年挑战
数据集的生理网2017年挑战[16]由一组的心电图记录采样在300赫兹,由一群专家分为四个不同的类:正常(N), AFib (a),其他节奏(O),和嘈杂的记录(~)。
下载并提取数据集使用的生理网2017年挑战ReadPhysionetData脚本,用于示例使用长短期记忆网络的ECG信号进行分类。
ReadPhysionetData
数据集是关于95 MB。根据您的网络连接,下载过程可能需要一些时间。
在媒介=目录(fullfile (matlabroot“例子”,“deeplearning_shared”,“主要”));ReadPhysionetData data =负载(“PhysionetData.mat”)信号= data.Signals;标签= data.Labels;
为一个例子,演示如何处理这些数据深度学习,明白了使用长短期记忆网络的ECG信号进行分类。
田纳西伊士曼过程(TEP)模拟
这个数据集包括垫文件从田纳西伊士曼转换过程(TEP)模拟数据。
下载田纳西伊士曼过程(TEP)模拟数据集[15]从网站(见MathWorks支持文件金宝app免责声明)。数据集有四个组成部分:无故障的培训,绝对没错的测试,错误的训练,和错误的测试。每个文件单独下载。
数据集是关于1.7 GB。根据您的网络连接,下载过程可能需要一些时间。
url金宝appSupportFiles =“//www.tatmou.com/金宝appsupportfiles/predmaint”;url = url金宝appSupportFiles +“/ chemical-process-fault-detection-data / faultytesting.mat”;流(“下载TEP错误的测试数据(1 GB)……”)websave (“faultytesting.mat”url);流(“完成。\ n”url = urlSu金宝apppportFiles +“/ chemical-process-fault-detection-data / faultytraining.mat”;流(“TEP错误的训练数据下载(613 MB)……”)websave (“faultytraining.mat”url);流(“完成。\ n”url = urlSu金宝apppportFiles +“/ chemical-process-fault-detection-data / faultfreetesting.mat”;流(“下载TEP无故障的测试数据(69 MB)……”)websave (“faultfreetesting.mat”url);流(“完成。\ n”url = urlSu金宝apppportFiles +“/ chemical-process-fault-detection-data / faultfreetraining.mat”;流(“下载TEP无故障的训练数据(36 MB)……”)websave (“faultfreetraining.mat”url);流(“完成。\ n”)
下载的文件加载到MATLAB®工作区。
负载(“faultfreetesting.mat”);负载(“faultfreetraining.mat”);负载(“faultytesting.mat”);负载(“faultytraining.mat”);
为一个例子,演示如何处理这些数据深度学习,明白了使用深度学习化工过程故障检测。
生理网心电图分割
生理网心电图分类数据集[16][17]由大约15分钟共有105名患者的心电图记录。获得每个记录,审查员把两个电极放在不同的位置在一个病人的胸部,导致双通道信号。数据库提供了信号区域标签由一个自动生成专家系统。
生理网下载心电图细分的数据集https://github.com/mathworks/physionet_ECG_segmentation通过下载的ZIP文件QT_Database-master.zip。数据集是关于72 MB。根据您的网络连接,下载过程可能需要一些时间。集downloadFolder数据的位置。
QT_Database-master.zip
downloadFolder = tempdir;url =“https://github.com/mathworks/physionet_ECG_segmentation/raw/master/QT_Database-master.zip”;文件名= fullfile (downloadFolder,“QT_Database-master.zip”);dataFolder = fullfile (downloadFolder,“QT_Database-master”);如果~存在(dataFolder“dir”)流(生理网”下载心电图分类数据集(72 MB)…”)websave(文件名,url);解压缩(文件名,downloadFolder);流(“完成。\ n”)结束
解创建文件夹QT_Database-master在你的临时目录中。这个文件夹包含的文本文件README.md和下列文件:
QT_Database-master
README.md
QTData.mat
Modified_physionet_data.txt
License.txt
QTData.mat包含生理网心电图细分数据。该文件Modified_physionet_data.txt提供了数据和源归因的描述操作应用到每个原始心电图记录。加载生理网垫心电图分割数据文件。
负载(fullfile (dataFolder“QTData.mat”))
为一个例子,演示如何处理这些数据深度学习,明白了波形分割使用深度学习。
合成行人、汽车和自行车反向散射
生成一个合成行人、汽车和自行车反向散射数据集使用辅助函数helperBackScatterSignals和helperDopplerSignatures使用的例子行人和自行车使用深度学习分类。
helperBackScatterSignals
helperDopplerSignatures
辅助函数helperBackScatterSignals生成指定数量的行人、骑自行车和汽车雷达的回报。对于每一个实现,返回信号维度N在- - - - - -N缓慢的,N快的数量夏令时间样品和N缓慢的数量标准时间样本。
辅助函数helperDopplerSignatures计算短时傅里叶变换)生成微多普勒雷达回波的签名。要获得微多普勒特征,使用辅助函数应用STFT和每个信号预处理方法。
在媒介=目录(fullfile (matlabroot“例子”,“分阶段”,“主要”));numPed = 1;%的行人数量实现numBic = 1;%的自行车数量实现numCar = 1;%的数量汽车实现[xPedRec, xBicRec xCarRec Tsamp] = helperBackScatterSignals (numPed, numBic numCar);(加速、T、F) = helperDopplerSignatures (xPedRec Tsamp);[SBic, ~, ~] = helperDopplerSignatures (xBicRec Tsamp);[伤疤,~,~]= helperDopplerSignatures (xCarRec Tsamp);
为一个例子,演示如何处理这些数据深度学习,明白了行人和自行车使用深度学习分类。
生成的波形
生成矩形,线性调频、相位编码使用helper函数波形helperGenerateRadarWaveforms使用的例子雷达波形分类使用深度学习。
helperGenerateRadarWaveforms
辅助函数helperGenerateRadarWaveforms产生3000信号的采样率为每个调制类型使用100 MHzphased.RectangularWaveform对于矩形脉冲,phased.LinearFMWaveform线性调频,phased.PhaseCodedWaveform相跟巴克码脉冲。
phased.RectangularWaveform
phased.LinearFMWaveform
phased.PhaseCodedWaveform
在媒介=目录(fullfile (matlabroot“例子”,“分阶段”,“主要”));[wav, modType] = helperGenerateRadarWaveforms;
为一个例子,演示如何处理这些数据深度学习,明白了雷达波形分类使用深度学习。
HMDB:一个巨大的人类运动数据库
HMBD51数据集包含7000年大约2 GB的视频数据片段51类,如喝,运行,俯卧撑。
下载并提取HMBD51数据集HMDB:一个巨大的人类运动数据库。数据集2 GB。根据您的网络连接,下载过程可能需要一些时间。
RAR文件,解压缩之后的文件名称和标签视频使用helper函数hmdb51Files使用的例子分类使用深度学习视频。集dataFolder数据的位置。
hmdb51Files
在媒介=目录(fullfile (matlabroot“例子”,“nnet”,“主要”));dataFolder = fullfile (tempdir,“hmdb51_org”);(文件、标签)= hmdb51Files (dataFolder);
为一个例子,演示如何处理这些数据深度学习,明白了分类使用深度学习视频。
工厂的报告
工厂报告数据集是一个表,它包含大约500报告的各种属性包括纯文本描述变量描述和一个分类标签变量类别。
描述
类别
从文件读取工厂报告数据“factoryReports.csv”。提取的文本数据和标签描述和类别分别列。
“factoryReports.csv”
文件名=“factoryReports.csv”;data = readtable(文件名,“TextType”,“字符串”);textData = data.Description;标签= data.Category;
为一个例子,演示如何处理这些数据深度学习,明白了使用深度学习分类文本数据。
文本分类、主题建模
莎士比亚的十四行诗
该文件sonnets.txt包含所有莎士比亚的十四行诗在一个文本文件。
sonnets.txt
读了莎士比亚的十四行诗的数据文件“sonnets.txt”。
“sonnets.txt”
文件名=“sonnets.txt”;textData = fileread(文件名);
十四行诗是缩进两个空格字符和由两个换行符。消除压痕使用取代和文本分割成单独的十四行诗分裂。删除主标题的前三个元素和十四行诗的标题,它出现在每个十四行诗。
取代
分裂
textData =取代(textData,”“,”“);textData =分裂(textData(换行换行));textData = textData(5:2:结束);
为一个例子,演示如何处理这些数据深度学习,明白了生成文本使用深度学习。
主题建模、文本生成
ArXiv的元数据
ArXiv API允许您访问科学发展的元数据提交https://arxiv.org包括抽象和主题领域。有关更多信息,请参见https://arxiv.org/help/api。
导入一组抽象和分类标签从数学论文使用arXiV API。
url =“https://export.arxiv.org/oai2?verb=ListRecords”+…“集=数学”+…“&metadataPrefix = arXiv”;选择= weboptions (“超时”,160);代码= webread (url选项);
为例展示如何解析返回的XML代码和进口更多的记录,知道了使用深度学习Multilabel文本分类。
书从古登堡计划
你可以从古腾堡计划那里下载很多书。例如,下载文本从刘易斯·卡罗尔的《爱丽丝漫游奇境记》中https://www.gutenberg.org/files/11/11-h/11-h.htm使用webread函数。
webread
url =“https://www.gutenberg.org/files/11/11-h/11-h.htm”;代码= webread (url);
里面的HTML代码包含相关的文本< p >(段落)元素。提取相关的文本通过解析HTML代码使用htmlTree函数,然后找到所有元素的元素名称“p”。
< p >
htmlTree
“p”
树= htmlTree(代码);选择器=“p”;子树= findElement(树,选择器);
从HTML子树中提取文本数据使用extractHTMLText函数和删除空元素。
extractHTMLText
textData = extractHTMLText(子树);textData (textData = =”“)= [];
为一个例子,演示如何处理这些数据深度学习,明白了词词文本生成使用深度学习。
周末更新
该文件weekendUpdates.xlsx包含示例社交媒体状态更新包含标签“#周末”和“#假期”。这个数据集需要文本分析工具箱™。
weekendUpdates.xlsx
从文件中提取文本数据weekendUpdates.xlsx使用readtable功能和从变量中提取文本数据TextData。
readtable
TextData
文件名=“weekendUpdates.xlsx”;台= readtable(文件名,“TextType”,“字符串”);textData = tbl.TextData;
对于一个例子,演示如何处理这些数据,看看在文本分析情绪(文本分析工具箱)。
情绪分析
罗马数字
CSV文件“romanNumerals.csv”包含小数1 - 1000在第一列和第二列对应的罗马数字。
“romanNumerals.csv”
加载decimal-Roman数字双从CSV文件“romanNumerals.csv”。
文件名= fullfile (“romanNumerals.csv”);选择= detectImportOptions(文件名,…“TextType”,“字符串”,…“ReadVariableNames”、假);选项。VariableNames = [“源”“目标”];选项。VariableTypes = [“字符串”“字符串”];data = readtable(文件名,选择);
为一个例子,演示如何处理这些数据深度学习,明白了Sequence-to-Sequence翻译使用注意。
Sequence-to-sequence翻译
财务报告
美国证券交易委员会(SEC)允许您访问财务报表通过电子数据收集、分析和检索(埃德加)API。有关更多信息,请参见https://www.sec.gov/edgar/searchedgar/accessing-edgar-data.htm。
下载这些数据,使用该函数financeReports附加的例子生成特定领域情感词典(文本分析工具箱)作为支持文金宝app件。要访问这个函数,打开生活的脚本示例。
financeReports
年= 2019;季度= 4;最大长度= 2 e6;textData = financeReports(年、季度、最大长度);
对于一个例子,演示如何处理这些数据,看看生成特定领域情感词典(文本分析工具箱)。
语音命令
语音命令数据集[18]由大约65000个音频文件包括标有1的12类是的,没有,在,从,以及类对应于未知的命令和背景噪音。
下载并提取语音命令数据集https://storage.googleapis.com/download.tensorflow.org/data/speech_commands_v0.01.tar.gz。数据集是关于1.4 GB。根据您的网络连接,下载过程可能需要一些时间。
集dataFolder数据的位置。使用audioDatastore创建一个数据存储包含文件名和相应的标签。
audioDatastore
dataFolder = tempdir;广告= audioDatastore (dataFolder,…“IncludeSubfolders”,真的,…“FileExtensions”,“wav”,…“LabelSource”,“foldernames”);
为一个例子,演示如何处理这些数据深度学习,明白了语音命令识别使用深度学习。
Mozilla共同的声音
Mozilla常见语音数据集由录音讲话和对应的文本文件。数据还包括人口统计元数据,比如年龄、性别、和口音。
下载并提取Mozilla常见语音数据集的数据集https://voice.mozilla.org/。是一个开放的数据集的数据集,这意味着它能随着时间的推移而增长。截至2019年10月,数据集是关于28 GB。根据您的网络连接,下载过程可能需要一些时间。集dataFolder数据的位置。使用audioDatastore创建一个数据存储包含文件名和相应的标签。
dataFolder = tempdir;广告= audioDatastore (fullfile (dataFolder,“剪辑”));
为一个例子,演示如何处理这些数据深度学习,明白了性别使用LSTM网络进行分类。
免费使用数字数据集
免费使用数字数据集,2000年1月29日,2019年,由获得的英语数字0到9的录音从四个扬声器。两个扬声器的这个版本是美国英语和母语的非本地的两个喇叭扬声器分别与比利时法国和德国口音的英语。数据采样在8000赫兹。
下载免费使用数字数据集(FSDD)录音https://github.com/Jakobovski/free-spoken-digit-dataset。
dataFolder = fullfile (tempdir,“free-spoken-digit-dataset”,“录音”);广告= audioDatastore (dataFolder);
为一个例子,演示如何处理这些数据深度学习,明白了语音数字识别与小波散射和深度学习。
柏林的情感语音数据库
柏林的情感语音数据库[19]包含535个口语话语10演员旨在传达的情绪:愤怒、无聊、厌恶、焦虑、恐惧、快乐、悲伤、或中性。情感是文本无关的。
文件名称代码指示演讲者ID、文本语言,情感,和版本。解释代码的网站包含一个关键和关于扬声器的附加信息,如性别和年龄。
下载柏林的情感语音数据库http://emodb.bilderbar.info/index - 1280. - html。数据集是大约40 MB。根据您的网络连接,下载过程可能需要一些时间。
dataFolder = tempdir;广告= audioDatastore (fullfile (dataFolder,“wav”));
为一个例子,演示如何处理这些数据深度学习,明白了语音情感识别。
图坦卡蒙声场景2017
下载并提取图坦卡蒙声场景2017数据集[20]从图坦卡蒙声场景2017年,开发数据集和2017年图坦卡蒙声场景,评估数据集。
数据集由十秒从15个声场景包括音频片段公共汽车,车,图书馆。
为一个例子,演示如何处理这些数据深度学习,明白了声场景识别使用后期融合。
Mesaros Annamaria,托尼Heittola,和图维尔塔宁。“声场景分类:概述DCASE 2017条目的挑战。”Proceedings of the International Workshop on Acoustic Signal Enhancement (2018):
411 - 415。
[1]湖,Brenden M。,Ruslan Salakhutdinov, and Joshua B. Tenenbaum. “Human-Level Concept Learning through Probabilistic Program Induction.”科学350年,没有。6266(2015年12月11日):1332 - 38。https://doi.org/10.1126/science.aab3050。
[2]TensorFlow团队。“花”https://www.tensorflow.org/datasets/catalog/tf_flowers
[3]Kat,郁金香、图像、https://www.flickr.com/photos/swimparallel/3455026124。Creative Commons许可(CC)。
Rob Bertholf [4]向日葵、图像、https://www.flickr.com/photos/robbertholf/20777358950。Creative Commons 2.0通用许可证。
[5]帕文,玫瑰、图像、https://www.flickr.com/photos/55948751@N00。Creative Commons 2.0通用许可证。
[6]约翰·海斯蓝蒲公英、图像、https://www.flickr.com/photos/foxypar4/645330051。Creative Commons 2.0通用许可证。
[7]Krizhevsky,亚历克斯。“学习的多层功能从微小的图像。”MSc thesis, University of Toronto, 2009.- 2009 tr.pdf https://www.cs.toronto.edu/%7ekriz/learning特性。
加布里埃尔·[8]Brostow J。,Julien Fauqueur, and Roberto Cipolla. “Semantic Object Classes in Video: A High-Definition Ground Truth Database.”模式识别的字母30日,没有。2(2009年1月):88 - 97。https://doi.org/10.1016/j.patrec.2008.04.005
[9]Kemker、罗纳德·卡尔Salvaggio,克里斯托弗Kanan。“高分辨率多光谱数据集语义分割。”ArXiv: 1703.01918 (Cs),2017年3月6日。https://arxiv.org/abs/1703.01918
[10]Isensee,费边,菲利普Kickingereder,沃尔夫冈•维克马丁Bendszus,克劳斯·h·Maier-Hein。“大脑肿瘤分割和Radiomics生存预测:2017年贡献的后代的挑战。“在Brainlesion:神经胶质瘤、多发性硬化、中风和创伤性脑损伤、编辑亚历桑德罗·Crimi Spyridon巴卡,Hugo Kuijf Bjoern Menze, Mauricio雷耶斯,10670:287 - 97。瑞士Cham:施普林格国际出版,2018年。https://doi.org/10.1007/978 - 3 - 319 - 75238 - 9 _25
[11]Ehteshami Bejnordi、Babak Mitko高山病,保罗•约翰内斯·范·迪斯特布拉姆·范·Ginneken尼科Karssemeijer, Geert Litjens,珀斯a·w·m·范德Laak et al。”诊断评估深度学习算法的检测在乳腺癌患者淋巴结转移。”《美国医学会杂志》318年,没有。22日(2017年12月12日):2199。https://doi.org/10.1001/jama.2017.14585
[12]奖赏,Mineichi,小君富山,学者Shimbo。“多维曲线分类使用通过区域。“模式识别字母20,不。11 - 13日(1999年11月):1103 - 11所示。https://doi.org/10.1016/s0167 - 8655 (99) 00077 - x
[13]奖赏,Mineichi,小君富山,学者Shimbo。日本元音数据集。通过UCI机器学习库分布。https://archive.ics.uci.edu/ml/datasets/Japanese +元音
[14]Saxena,阿凯Goebel。“涡扇发动机退化仿真数据集。”NASA艾姆斯预测数据存储库https://ti.arc.nasa.gov/tech/dash/groups/pcoe/prognostic-data-repository/NASA艾姆斯研究中心,莫菲特场,CA
[15]Rieth,科里。,Ben D. Amsel, Randy Tran, and Maia B. Cook. "Additional Tennessee Eastman Process Simulation Data for Anomaly Detection Evaluation."哈佛Dataverse,2017年第1版。https://doi.org/10.7910/DVN/6C3JR1。
[16]不氩L。,Luis A. N. Amaral, Leon Glass, Jeffery M. Hausdorff, Plamen Ch. Ivanov, Roger G. Mark, Joseph E. Mietus, George B. Moody, Chung-Kang Peng, and H. Eugene Stanley. "PhysioBank, PhysioToolkit, and PhysioNet: Components of a New Research Resource for Complex Physiologic Signals."循环101年,23号,2000,pp. e215-e220。https://circ.ahajournals.org/content/101/23/e215.full
[17]拉古纳,巴勃罗,罗杰·g·马克,必要l . Goldberger和乔治·b·穆迪。“数据库评估算法测量心电图QT间隔和其他波形的。”计算机在心脏病学24日,1997年,页673 - 676。
[18]监狱长P。“语音命令:一个公共数据集单字原图语音识别”,2017。可以从http://download.tensorflow.org/data/speech_commands_v0.01.tar.gz。版权2017年谷歌。语音命令数据集是创作共用署名4.0许可下的,可用:https://creativecommons.org/licenses/by/4.0/legalcode。
[19]Burkhardt,费利克斯,阿斯特丽德Paeschke,梅丽莎·a .创建人沃尔特·f·Sendlmeier Weiss和便雅悯。“德国情感语音数据库。”Interspeech学报》2005。葡萄牙里斯本:国际言语交际协会,2005。
[20]Mesaros Annamaria,托尼Heittola,和图维尔塔宁。“声场景分类:概述DCASE 2017条目的挑战。”在2018年16日国际研讨会声学信号增强(IWAENC),411 - 415页。IEEE 2018。
trainingOptions|trainNetwork
trainingOptions
trainNetwork
你点击一个链接对应MATLAB命令:
运行该命令通过输入MATLAB命令窗口。Web浏览器不支持MATLAB命令。金宝app
选择一个网站翻译内容,看到当地事件和提供。根据你的位置,我们建议您选择:。
你也可以从下面的列表中选择一个网站:
选择中国网站(中文或英文)最佳站点的性能。其他MathWorks国家网站不优化的访问你的位置。
联系你当地的办公室
得到审判现在