数据集的深度学习- MATLAB和Simulink MathWorks印度金宝app - 金宝app,下载188bet金宝搏,金宝搏官方网站

深度学习的数据集

使用这些数据集与深度学习应用程序开始。

请注意

的一些代码中使用这些数据集描述使用函数附加到例子作为支持文件。金宝app使用这些功能,开放的示例脚本。

图像数据集

数据集描述任务

数据集	描述	任务
数字	10000年的数字数据集由合成手写数字灰度图像。28-by-28每个图像像素和有关联的标签表示数字图像代表(0 - 9)。每个图像一直旋转一定的角度。当加载图像阵列,您还可以加载图像的旋转角度。数字数据加载内存数值数组使用`digitTrain4DArrayData`和`digitTest4DArrayData`功能。 [XTrain, YTrain anglesTrain] = digitTrain4DArrayData;[XTest,欧美,anglesTest] = digitTest4DArrayData; 示例显示了如何处理这些数据的深度学习,明白了监测深度学习培训的进展和火车卷积神经网络回归。	图像分类和图像回归
数字数据加载图像数据存储使用`imageDatastore`功能和指定包含图像数据的文件夹。 dataFolder = fullfile (toolboxdir (“nnet”),“nndemos”,“nndatasets”,“DigitDataset”);imd = imageDatastore (dataFolder,…“IncludeSubfolders”,真的,“LabelSource”,“foldernames”); 为一个例子,演示如何处理这些数据深度学习,明白了创建简单的深度学习网络分类。	图像分类
MNIST (代表)	MNIST数据集包含70000份手写数字分成训练集和测试分区60000年和10000年的图像,分别。28-by-28每个图像像素和有关联的标签表示数字图像代表(0 - 9)。下载MNIST文件http://yann.lecun.com/exdb/mnist/和负载数据集到工作区中。加载的数据文件,MATLAB数组,地方工作目录中的文件,然后使用helper函数`processImagesMNIST`和`processLabelsMNIST`使用的例子火车变分Autoencoder (VAE)来生成图像。要访问这些功能,打开生活的脚本示例。在媒介=目录(fullfile (matlabroot“例子”,“nnet”,“主要”));filenameImagesTrain =“train-images-idx3-ubyte.gz”;filenameLabelsTrain =“train-labels-idx1-ubyte.gz”;filenameImagesTest =“t10k-images-idx3-ubyte.gz”;filenameLabelsTest =“t10k-labels-idx1-ubyte.gz”;XTrain = processImagesMNIST (filenameImagesTrain);YTrain = processLabelsMNIST (filenameLabelsTrain);XTest = processImagesMNIST (filenameImagesTest);欧美= processLabelsMNIST (filenameLabelsTest); 为一个例子,演示如何处理这些数据深度学习,明白了火车变分Autoencoder (VAE)来生成图像。恢复路径,使用`路径`函数。路径(媒介);	图像分类
Omniglot	Omniglot数据集包含50个字母的字符集,分为30集培训和20集进行测试[1]。每个字母都包含一个字符数,从14 Ojibwe(加拿大原住民音节)曾到55。最后,每个角色都有20个手写的观察。下载并提取Omniglot数据集https://github.com/brendenlake/omniglot。集`downloadFolder`数据的位置。 downloadFolder = tempdir;url =“https://github.com/brendenlake/omniglot/raw/master/python”;urlTrain = url +“/ images_background.zip”;urlTest = url +“/ images_evaluation.zip”;filenameTrain = fullfile (downloadFolder,“images_background.zip”);filenameTest = fullfile (downloadFolder,“images_evaluation.zip”);dataFolderTrain = fullfile (downloadFolder,“images_background”);dataFolderTest = fullfile (downloadFolder,“images_evaluation”);如果~存在(dataFolderTrain“dir”)流(“下载Omniglot训练数据集(4.5 MB)…”)websave (filenameTrain urlTrain);解压缩(filenameTrain downloadFolder);流(“完成。\ n”)结束如果~存在(dataFolderTest“dir”)流(“下载Omniglot测试数据(3.2 MB)…”)websave (filenameTest urlTest);解压缩(filenameTest downloadFolder);流(“完成。\ n”)结束负荷训练和测试数据的图像数据存储,使用`imageDatastore`函数。手动指定标签从文件中提取标签名称和设置`标签`财产。 imdsTrain = imageDatastore (dataFolderTrain,…“IncludeSubfolders”,真的,…“LabelSource”,“没有”);文件= imdsTrain.Files;部分=分裂(文件、filesep);标签=加入(部分(:,(end-2): (end-1)),“_”);imdsTrain。标签= categorical(labels); imdsTest = imageDatastore(dataFolderTest,…“IncludeSubfolders”,真的,…“LabelSource”,“没有”);文件= imdsTest.Files;部分=分裂(文件、filesep);标签=加入(部分(:,(end-2): (end-1)),“_”);imdsTest。标签= categorical(labels); 为一个例子,演示如何处理这些数据深度学习,明白了火车暹罗网络比较图像。	图像相似度
花图片致谢:[3][4][5][6]	花的花朵数据集包含3670张图片属于五类(黛西,蒲公英,玫瑰,向日葵,郁金香)[2]。下载并提取花数据集http://download.tensorflow.org/example_images/flower_photos.tgz。数据集是关于218 MB。集`downloadFolder`数据的位置。 url =“http://download.tensorflow.org/example_images/flower_photos.tgz”;downloadFolder = tempdir;文件名= fullfile (downloadFolder,“flower_dataset.tgz”);dataFolder = fullfile (downloadFolder,“flower_photos”);如果~存在(dataFolder“dir”)流(“花下载数据集(218 MB)…”)websave(文件名,url);解压(文件名,downloadFolder)流(“完成。\ n”)结束加载数据作为一个图像数据存储使用`imageDatastore`功能和指定包含图像数据的文件夹。 imd = imageDatastore (dataFolder,…“IncludeSubfolders”,真的,…“LabelSource”,“foldernames”); 为一个例子,演示如何处理这些数据深度学习,明白了火车生成对抗网络(甘)。	图像分类
例如食物图片	食物的例子图像数据集包含978年9类食物的照片(caesar_salad,caprese_salad,french_fries,greek_salad,汉堡,hot_dog,披萨,生鱼片,寿司)。下载示例食物图像数据集使用`download金宝appSupportFile`使用功能和提取图像`解压缩`函数。该数据集是77 MB。流(“下载示例食物图像数据集(77 MB)……”)文件名= matlab.internal.examples.downloadSupport金宝appFile (“nnet”,…“数据/ ExampleFoodImageDataset.zip”);流(“完成。\ n”)filepath = fileparts(文件名);dataFolder = fullfile (filepath,“ExampleFoodImageDataset”);解压缩(文件名,dataFolder); 为一个例子,演示如何处理这些数据深度学习,明白了视图使用tsne网络行为。	图像分类
CIFAR-10 (代表)	CIFAR-10数据集包含60000彩色图像的大小32-by-32像素,属于10类(飞机,汽车,鸟,猫,鹿,狗,青蛙,马,船,卡车)[7]。有6000个图像每个类。数据集分为训练集50000张图片和10000张照片的测试集。该数据集是一种最广泛使用的数据集进行测试的新图像分类模型。下载并提取CIFAR-10数据集https://www.cs.toronto.edu/%7Ekriz/cifar-10-matlab.tar.gz。数据集是关于175 MB。集`downloadFolder`数据的位置。 url =“https://www.cs.toronto.edu/ ~ kriz / cifar-10-matlab.tar.gz”;downloadFolder = tempdir;文件名= fullfile (downloadFolder,“cifar-10-matlab.tar.gz”);dataFolder = fullfile (downloadFolder,“cifar-10-batches-mat”);如果~存在(dataFolder“dir”)流(“下载CIFAR-10数据集(175 MB)…”);websave(文件名、url);解压(文件名,downloadFolder);流(“完成。\ n”)结束将数据转换成数值型数组使用helper函数`loadCIFARData`使用的例子火车残余网络图像分类。要访问这个函数,打开生活的脚本示例。在媒介=目录(fullfile (matlabroot“例子”,“nnet”,“主要”));[XTrain, YTrain XValidation YValidation] = loadCIFARData (downloadFolder); 为一个例子,演示如何处理这些数据深度学习,明白了火车残余网络图像分类。恢复路径,使用`路径`函数。路径(媒介);	图像分类
MathWorks^®营销上	MathWorks营销数据集是一个小数据集包含75的图像MathWorks商品,属于五个不同的类(帽,多维数据集,打牌,螺丝刀,火炬)。您可以使用此数据集尝试转移迅速学习和图像分类。大小的图像是227 - 227 - 3。提取MathWorks营销数据集。文件名=“MerchData.zip”;dataFolder = fullfile (tempdir,“MerchData”);如果~存在(dataFolder“dir”解压缩(文件名,tempdir);结束加载数据作为一个图像数据存储使用`imageDatastore`功能和指定包含图像数据的文件夹。 imd = imageDatastore (dataFolder,…“IncludeSubfolders”,真的,“LabelSource”,“foldernames”); 示例显示了如何处理这些数据的深度学习,明白了学习开始转移和火车深入学习网络对新图像进行分类。	图像分类
CamVid	CamVid数据集是一组图像包含街道视图获得汽车驱动[8]。数据集是用于训练网络执行的语义分割图像和提供了32进行像素级标签语义类,包括车,行人,路。大小的图像是720 - 960 - 3。下载并提取CamVid数据集http://web4.cs.ucl.ac.uk/staff/g.brostow/MotionSegRecData/。数据集是关于573 MB。集`downloadFolder`数据的位置。 downloadFolder = tempdir;url =“http://web4.cs.ucl.ac.uk/staff/g.brostow/MotionSegRecData”urlImages = url +“/文件/ 701 _stillsraw_full.zip”;urlLabels = url +“/数据/ LabeledApproved_full.zip”;dataFolder = fullfile (downloadFolder,“CamVid”);dataFolderImages = fullfile (dataFolder,“图片”);dataFolderLabels = fullfile (dataFolder,“标签”);filenameLabels = fullfile (dataFolder,“labels.zip”);filenameImages = fullfile (dataFolder,“images.zip”);如果~存在(filenameLabels“文件”)\| \| ~存在(imagesZip“文件”mkdir (dataFolder)流(“下载CamVid图像数据集(557 MB)…”);websave (filenameImages urlImages);解压缩(filenameImages dataFolderImages);流(“完成。\ n”)流(“下载CamVid数据集标签(16 MB)…”);websave (filenameLabels urlLabels);解压缩(filenameLabels dataFolderLabels);流(“完成。\ n”)结束加载数据作为一个像素标签数据存储使用`pixelLabelDatastore`函数包含标签数据,并指定文件夹类,标签id。使训练更容易,集团的一些原始类减少从32到11类的数量。标签标识,使用helper函数`camvidPixelLabelIDs`使用的例子语义分割使用深度学习。要访问这个函数,打开生活的脚本示例。在媒介=目录(fullfile (matlabroot“例子”,“deeplearning_shared”,“主要”));imd = imageDatastore (dataFolderImages,“IncludeSubfolders”,真正的);类= [“天空”“建筑”“极”“路”“路面”“树”…“SignSymbol”“篱笆”“汽车”“行人”“自行车”];labelIDs = camvidPixelLabelIDs;pxds = pixelLabelDatastore (dataFolderLabels、类labelIDs); 为一个例子,演示如何处理这些数据深度学习,明白了语义分割使用深度学习。恢复路径,使用`路径`函数。路径(媒介);	语义分割
车辆	295年的车辆数据集由图像包含一个或两个标记的实例。这个小数据集用于探索YOLO-v2训练过程,但在实践中,需要更多的标签图片来训练一个健壮的探测器。大小的图像是720 - 960 - 3。提取车辆数据集。`dataFolder`数据的位置。文件名=“vehicleDatasetImages.zip”;dataFolder = fullfile (tempdir,“vehicleImages”);如果~存在(dataFolder“dir”解压缩(文件名,tempdir);结束加载数据集作为一个表的文件名和边界框提取垫文件和文件名转换为绝对的文件路径。 data =负载(“vehicleDatasetGroundTruth.mat”);vehicleDataset = data.vehicleDataset;vehicleDataset。imageFilename = fullfile (tempdir vehicleDataset.imageFilename); 创建一个图像数据存储包含图片和一盒标签包含边界框使用的数据存储`imageDatastore`和`boxLabelDatastore`函数,分别。结合生成的数据存储使用`结合`函数。 filenamesImages = vehicleDataset.imageFilename;tblBoxes = vehicleDataset (:,“汽车”);imd = imageDatastore (filenamesImages);建筑物= boxLabelDatastore (tblBoxes);cd =结合(imd,建筑物); 为一个例子,演示如何处理这些数据深度学习,明白了对象检测使用YOLO v2意思深入学习。	对象检测
RIT-18	RIT-18数据集包含了图像数据被一架无人机在哈姆林海滩州立公园在纽约州[9]。数据包含标签的训练、验证和测试集,包括18个对象类标签路标,树,建筑。数据集是关于3 GB。下载RIT-18数据集https://home.cis.rit.edu/ cnspci /其他/数据/ rit18_data.mat。集`downloadFolder`数据的位置。 downloadFolder = tempdir;url =“https://home.cis.rit.edu/ cnspci /其他/数据/ rit18_data.mat ';文件名= fullfile (downloadFolder,“rit18_data.mat”);如果~存在(文件名,“文件”)流(“下载哈姆林海滩的数据集(3 GB)…”);websave(文件名、url);流(“完成。\ n”)结束为一个例子,演示如何处理这些数据深度学习,明白了多光谱图像的语义分割使用深度学习。	语义分割
有钱的孩子	小鬼数据集包含了脑部肿瘤的MRI扫描,即神经胶质瘤,这是最常见的原发性脑恶性肿瘤[10]。数据集包含750个4 - d卷,每个代表一个堆栈的3 d图像。每个4 d体积大小240 - - 240 - 155 - 4,在前三个维度对应高度,宽度和深度的三维体积的形象。第四维对应于不同的扫描方式。484数据集分为训练与体元标签和266个测试卷卷。数据集是关于7 GB。创建一个目录来存储小鬼数据集。 dataFolder = fullfile (tempdir,“小鬼”);如果~存在(dataFolder“dir”mkdir (dataFolder);结束下载的小鬼数据医学分割十项全能通过单击“下载数据”链接。下载“Task01_BrainTumour。焦油”文件。 TAR文件提取到指定的目录`dataFolder`变量。那么,如果提取成功`dataFolder`包含一个目录命名`Task01_BrainTumour`这有三个子目录:`imagesTr`,`imagesTs`,`labelsTr`。为一个例子,演示如何处理这些数据深度学习,明白了三维大脑肿瘤分割使用深度学习。	语义分割
Camelyon16	Camelyon16挑战的数据包含400张幻灯片图片(WSIs)淋巴结从两个独立的来源,分为270 130训练图像和测试图像[11]。数据集是451 GB。训练数据集包含159 WSIs的正常淋巴结和111 WSIs淋巴结的肿瘤组织和健康组织。通常,肿瘤组织的一小部分健康的组织。地面实况病变边界伴随肿瘤图像的坐标。创建目录来存储Camelyon16数据集。 dataFolderTrain = fullfile (tempdir,“Camelyon16”,“培训”);dataFolderNormalTrain = fullfile (dataFolderTrain,“正常”);dataFolderTumorTrain = fullfile (dataFolderTrain,“肿瘤”);dataFolderAnnotationsTrain = fullfile (dataFolderTrain,“lesion_annotations”);如果~存在(dataFolderTrain“dir”mkdir (dataFolderTrain);mkdir (dataFolderNormalTrain);mkdir (dataFolderTumorTrain);mkdir (dataFolderAnnotationsTrain);结束下载Camelyon16数据集Camelyon17点击第一个“CAMELYON16数据集”链接。打开“培训”目录中,然后按照以下步骤: 下载“lesion_annotations。邮政”文件。提取文件到指定的目录`dataFolderAnnotationsTrain`变量。打开“正常”的目录。图片下载到指定的目录`dataFolderNormalTrain`变量。打开“肿瘤”目录。图片下载到指定的目录`dataFolderTumorTrain`变量。为一个例子,演示如何处理这些数据深度学习,明白了预处理多分辨率图像进行训练分类网络(图像处理工具箱)。	图像分类(大图片)
常见的对象上下文(可可) (代表)	可可2014训练图像数据集包含82783张图片。注释数据包含至少五个标题对应每个图像。创建目录来存储可可数据集。 dataFolder = fullfile (tempdir,“可可”);如果~存在(dataFolder“dir”mkdir (dataFolder);结束下载并提取可可2014训练图像和字幕https://cocodataset.org/下载通过单击“2014训练图像”和“2014火车/ Val注释”链接,分别。数据保存在指定的文件夹`dataFolder`。从文件中提取标题`captions_train2014.json`使用`jsondecode`函数。文件名= fullfile (dataFolder,“annotations_trainval2014”,“注释”,…“captions_train2014.json”);str = fileread(文件名);data = jsondecode (str); 的`注释`结构的字段包含图像字幕所需的数据。为一个例子,演示如何处理这些数据深度学习,明白了图像字幕使用注意。	图像字幕
IAPR TC-12 (代表)	的IAPR TC-12基准由20000名仍然自然图像[14]。数据集包括照片的人、动物、城市、和更多。数据文件大约是1.8 GB。下载IAPR TC-12数据集。 dataDir = fullfile (tempdir,“iaprtc12”);url =“http://www-i6.informatik.rwth-aachen.de/imageclef/resources/iaprtc12.tgz”;如果~存在(dataDir“dir”)流(“下载IAPR TC-12数据集(1.8 GB)…\ n ');试一试解压(url, dataDir);抓%在一些Windows机器上,将命令解压. tgz抛出一个错误%的文件。重命名.tg并再试一次。文件名= fullfile (tempdir,“iaprtc12.tg”);websave(文件名、url);解压(文件名,dataDir);结束流(“做。\ n \ n”);结束加载数据作为一个图像数据存储使用`imageDatastore`函数。指定包含图像数据的文件夹和文件扩展名。 imageDir = fullfile (dataDir,“图片”)ext = {“jpg”,bmp格式的,“使用”};imd = imageDatastore (imageDir,…“IncludeSubfolders”,真的,“FileExtensions”ext); 为一个例子,演示如何处理这些数据深度学习,明白了使用深度学习提高图像分辨率。	Image-to-image回归
苏黎世原始RGB	苏黎世原始RGB数据集包含48043注册对原始和RGB空间训练图像补丁的大小448 - - 448[15]。数据集包含两个单独的测试集。一个测试集由1204空间注册对原始和RGB图像补丁的大小448 - - 448。未登记的全分辨率的其他测试集由原始和RGB图像。数据集是22 GB。创建一个目录来存储苏黎世原始RGB数据集。 imageDir = fullfile (tempdir,“ZurichRAWToRGB”);如果~存在(imageDir“dir”mkdir (imageDir);结束下载的数据集,请求访问使用苏黎世原始RGB数据集的形式。提取数据到指定的目录`imageDir`变量。那么,如果提取成功`imageDir`包含三个目录:`full_resolution`,`测试`,`火车`。< p > 为一个例子,演示如何处理这些数据深度学习,明白了使用深度学习开发相机处理管道。	Image-to-image回归
早已应用(SID)	(SID)早已应用数据集提供了注册对原始图像相同的场景[16]。在每一对,一个图像有一个短的曝光时间和曝光不足,而另一个图像曝光时间较长,是良好的曝光。索尼相机数据的大小SID 25 GB的数据集。指定`dataDir`的期望位置数据。 dataDir = fullfile (tempdir,“席德”);如果~存在(dataDir“dir”mkdir (dataDir);结束下载的数据集,点击这个链接:https://storage.googleapis.com/isl-datasets/SID/Sony.zip。提取数据到指定的目录`dataDir`变量。当提取成功,`dataDir`包含目录`索尼`有两个子目录:`长`和`短`。中的文件`长`子目录中有一个长时间的曝光,良好的曝光。中的文件`短`子目录中有一个短的曝光和曝光不足和黑暗。数据集还提供了文本文件,描述如何分区的文件到训练、验证和测试数据集。“Sony_train_list移动文件。txt”、“Sony_val_list。txt”,和“Sony_test_list。txt”指定的目录`dataDir`变量。为一个例子,演示如何处理这些数据深度学习,明白了照亮极其黑暗的图片使用深度学习。	Image-to-image回归
生活在野外	生活在野外的数据集包含1162张照片被移动设备,有七个额外的培训图片[17]。平均每个图像是额定175人规模的[100]。数据集提供了主观评分的平均值和标准偏差为每个图像。指定`imageDir`的期望位置数据。 imageDir = fullfile (tempdir,“LIVEInTheWild”);如果~存在(imageDir“dir”mkdir (imageDir);结束下载数据集按照说明书中列出生活在野外数据库图像质量的挑战。提取数据到指定的目录`imageDir`变量。当提取成功,`imageDir`包含两个目录:`数据`和`图片`。为一个例子,演示如何处理这些数据深度学习,明白了使用神经图像量化图像质量评估。	图像分类
混凝土裂缝图像的分类	混凝土裂缝图像分类数据集包含图像的两类:“负面”的图像,没有裂缝出现在道路与裂缝和“积极”的图像[18][19]。每个类的数据集提供了20000张图片。数据集的大小是235 MB。指定`dataDir`的期望位置数据。 dataDir = fullfile (tempdir,“ConcreteCracks”);如果~存在(dataDir“dir”mkdir (dataDir);结束下载的数据集,点击这个链接:混凝土裂缝图像的分类。提取获得RAR文件的ZIP文件,然后提取RAR文件的内容到指定的目录`dataDir`变量。那么,如果提取成功`dataDir`包含两个子目录:`负`和`积极的`。为一个例子,演示如何处理这些数据深度学习,明白了嵌入的图像异常检测使用Pretrained ResNet-18特性。	图像分类
米尔wm - 811 k(晶圆缺陷地图)	晶圆缺陷地图数据集由811457片地图图片,其中包括172950标记图像[20][21]。每个图像只有三像素值。值0表示背景,值1代表正确表现死亡,和值2代表有缺陷的模具。9个标签的标签图像有一个基于空间模式的缺陷。数据集的大小是3.5 GB。指定`dataDir`的期望位置数据,然后下载晶圆缺陷地图数据集。 dataDir = fullfile (tempdir,“WaferDefects”);dataURL =“http://mirlab.org/dataSet/public/MIR-WM811K.zip”;dataMatFile = fullfile (dataDir,“MIR-WM811K”,“MATLAB”,“WM811K.mat”);如果存在(dataMatFile“文件”)~ = 2解压(dataURL dataDir);结束数据存储在一个垫子文件作为一个结构数组。数据集加载到工作区。 waferData =负载(dataMatFile);waferData = waferData.data; 为一个例子,演示如何处理这些数据深度学习,明白了使用深度学习分类异常在晶圆缺陷地图。	图像分类
丸质量控制(丸质量控制)	避孕药质检数据集包含图像的三个类:“正常”的图片没有缺陷,“芯片”图像芯片缺陷药丸,和“污垢”图像与灰尘污染。43芯片数据集提供了149个常规的图像,图像,和138年污垢图像。数据集的大小是3.57 MB。指定`dataDir`的期望位置数据,然后下载丸质量控制数据集。 dataDir = fullfile (tempdir,“PillDefects”);imageDir = fullfile (dataDir,“pillQC-main”);如果~存在(imageDir“dir”)解压缩(“https://github.com/matlab-deep-learning/pillQC/archive/refs/heads/main.zip”,dataDir);结束加载数据作为一个图像数据存储使用`imageDatastore`功能和指定包含图像数据的文件夹。 imageDir = fullfile (dataDir,“pillQC-main”,“图片”);imd = imageDatastore (imageDir IncludeSubfolders = true, LabelSource =“foldernames”); 为一个例子,演示如何处理这些数据深度学习,明白了使用分类神经网络可辩解的看到下面成了图像异常检测。	图像分类
乳腺超声图像(商业)	乳腺超声图像(商业)数据集包含二维乳腺超声图像[22]。数据集包含133个正常图像,图像与良性肿瘤,487和210图像与恶性肿瘤。每个肿瘤超声图像有一个相应的语义分割掩模图像训练网络。肿瘤临床放射学家面具标签了。数据集的大小大约是197 MB。从MathWorks网站下载商业数据集。 zipFile = matlab.internal.examples.download金宝appSupportFile (“图像”,“数据/ Dataset_BUSI.zip”);filepath = fileparts (zipFile);解压缩(zipFile filepath) 加载数据作为一个图像数据存储使用`imageDatastore`功能和品牌形象`正常的`,`良性的`,或`恶性`根据其文件夹的名称。 imageDir = fullfile (filepath,“Dataset_BUSI_with_GT”);imd = imageDatastore (imageDir IncludeSubfolders = true, LabelSource =“foldernames”); 为一个例子,演示如何处理这些数据深度学习,明白了从超声乳腺肿瘤分割使用深度学习。	语义分割
儿童和青少年神经发育倡议(候选材料)神经影像数据集	候选材料的数据集(HC_001子集)包含一个大脑核磁共振图像体积和其相应的分割图像标签[23]。数据集的总大小是大约2.5 MB。从MathWorks网站下载候选材料的数据集。 zipFile = matlab.internal.examples.download金宝appSupportFile (“图像”,“数据/ brainSegData.zip”);filepath = fileparts (zipFile);解压缩(zipFile filepath) dataDir = fullfile (filepath,“brainSegData”); 为一个例子,演示如何加载和处理这些数据深度学习,明白了大脑MRI分割使用Pretrained 3 d U-Net网络	语义分割

数字

10000年的数字数据集由合成手写数字灰度图像。28-by-28每个图像像素和有关联的标签表示数字图像代表(0 - 9)。每个图像一直旋转一定的角度。当加载图像阵列,您还可以加载图像的旋转角度。

数字数据加载内存数值数组使用digitTrain4DArrayData和digitTest4DArrayData功能。

[XTrain, YTrain anglesTrain] = digitTrain4DArrayData;[XTest,欧美,anglesTest] = digitTest4DArrayData;

示例显示了如何处理这些数据的深度学习,明白了监测深度学习培训的进展和火车卷积神经网络回归。

图像分类和图像回归

数字数据加载图像数据存储使用imageDatastore功能和指定包含图像数据的文件夹。

dataFolder = fullfile (toolboxdir (“nnet”),“nndemos”,“nndatasets”,“DigitDataset”);imd = imageDatastore (dataFolder,…“IncludeSubfolders”,真的,“LabelSource”,“foldernames”);

为一个例子,演示如何处理这些数据深度学习,明白了创建简单的深度学习网络分类。

图像分类

MNIST

(代表)

MNIST数据集包含70000份手写数字分成训练集和测试分区60000年和10000年的图像,分别。28-by-28每个图像像素和有关联的标签表示数字图像代表(0 - 9)。

下载MNIST文件http://yann.lecun.com/exdb/mnist/和负载数据集到工作区中。加载的数据文件,MATLAB数组,地方工作目录中的文件,然后使用helper函数processImagesMNIST和processLabelsMNIST使用的例子火车变分Autoencoder (VAE)来生成图像。要访问这些功能,打开生活的脚本示例。

在媒介=目录(fullfile (matlabroot“例子”,“nnet”,“主要”));filenameImagesTrain =“train-images-idx3-ubyte.gz”;filenameLabelsTrain =“train-labels-idx1-ubyte.gz”;filenameImagesTest =“t10k-images-idx3-ubyte.gz”;filenameLabelsTest =“t10k-labels-idx1-ubyte.gz”;XTrain = processImagesMNIST (filenameImagesTrain);YTrain = processLabelsMNIST (filenameLabelsTrain);XTest = processImagesMNIST (filenameImagesTest);欧美= processLabelsMNIST (filenameLabelsTest);

为一个例子,演示如何处理这些数据深度学习,明白了火车变分Autoencoder (VAE)来生成图像。

恢复路径,使用路径函数。

路径(媒介);

图像分类

Omniglot

Omniglot数据集包含50个字母的字符集,分为30集培训和20集进行测试[1]。每个字母都包含一个字符数,从14 Ojibwe(加拿大原住民音节)曾到55。最后,每个角色都有20个手写的观察。

下载并提取Omniglot数据集https://github.com/brendenlake/omniglot。集downloadFolder数据的位置。

downloadFolder = tempdir;url =“https://github.com/brendenlake/omniglot/raw/master/python”;urlTrain = url +“/ images_background.zip”;urlTest = url +“/ images_evaluation.zip”;filenameTrain = fullfile (downloadFolder,“images_background.zip”);filenameTest = fullfile (downloadFolder,“images_evaluation.zip”);dataFolderTrain = fullfile (downloadFolder,“images_background”);dataFolderTest = fullfile (downloadFolder,“images_evaluation”);如果~存在(dataFolderTrain“dir”)流(“下载Omniglot训练数据集(4.5 MB)…”)websave (filenameTrain urlTrain);解压缩(filenameTrain downloadFolder);流(“完成。\ n”)结束如果~存在(dataFolderTest“dir”)流(“下载Omniglot测试数据(3.2 MB)…”)websave (filenameTest urlTest);解压缩(filenameTest downloadFolder);流(“完成。\ n”)结束

负荷训练和测试数据的图像数据存储,使用imageDatastore函数。手动指定标签从文件中提取标签名称和设置标签财产。

imdsTrain = imageDatastore (dataFolderTrain,…“IncludeSubfolders”,真的,…“LabelSource”,“没有”);文件= imdsTrain.Files;部分=分裂(文件、filesep);标签=加入(部分(:,(end-2): (end-1)),“_”);imdsTrain。标签= categorical(labels); imdsTest = imageDatastore(dataFolderTest,…“IncludeSubfolders”,真的,…“LabelSource”,“没有”);文件= imdsTest.Files;部分=分裂(文件、filesep);标签=加入(部分(:,(end-2): (end-1)),“_”);imdsTest。标签= categorical(labels);

为一个例子,演示如何处理这些数据深度学习,明白了火车暹罗网络比较图像。

图像相似度

花

图片致谢:[3][4][5][6]

花的花朵数据集包含3670张图片属于五类(黛西,蒲公英,玫瑰,向日葵,郁金香)[2]。

下载并提取花数据集http://download.tensorflow.org/example_images/flower_photos.tgz。数据集是关于218 MB。集downloadFolder数据的位置。

url =“http://download.tensorflow.org/example_images/flower_photos.tgz”;downloadFolder = tempdir;文件名= fullfile (downloadFolder,“flower_dataset.tgz”);dataFolder = fullfile (downloadFolder,“flower_photos”);如果~存在(dataFolder“dir”)流(“花下载数据集(218 MB)…”)websave(文件名,url);解压(文件名,downloadFolder)流(“完成。\ n”)结束

加载数据作为一个图像数据存储使用imageDatastore功能和指定包含图像数据的文件夹。

imd = imageDatastore (dataFolder,…“IncludeSubfolders”,真的,…“LabelSource”,“foldernames”);

为一个例子,演示如何处理这些数据深度学习,明白了火车生成对抗网络(甘)。

图像分类

例如食物图片

食物的例子图像数据集包含978年9类食物的照片(caesar_salad,caprese_salad,french_fries,greek_salad,汉堡,hot_dog,披萨,生鱼片,寿司)。

下载示例食物图像数据集使用download金宝appSupportFile使用功能和提取图像解压缩函数。该数据集是77 MB。

流(“下载示例食物图像数据集(77 MB)……”)文件名= matlab.internal.examples.downloadSupport金宝appFile (“nnet”,…“数据/ ExampleFoodImageDataset.zip”);流(“完成。\ n”)filepath = fileparts(文件名);dataFolder = fullfile (filepath,“ExampleFoodImageDataset”);解压缩(文件名,dataFolder);

为一个例子,演示如何处理这些数据深度学习,明白了视图使用tsne网络行为。

图像分类

CIFAR-10

(代表)

CIFAR-10数据集包含60000彩色图像的大小32-by-32像素,属于10类(飞机,汽车,鸟,猫,鹿,狗,青蛙,马,船,卡车)[7]。有6000个图像每个类。

数据集分为训练集50000张图片和10000张照片的测试集。该数据集是一种最广泛使用的数据集进行测试的新图像分类模型。

下载并提取CIFAR-10数据集https://www.cs.toronto.edu/%7Ekriz/cifar-10-matlab.tar.gz。数据集是关于175 MB。集downloadFolder数据的位置。

url =“https://www.cs.toronto.edu/ ~ kriz / cifar-10-matlab.tar.gz”;downloadFolder = tempdir;文件名= fullfile (downloadFolder,“cifar-10-matlab.tar.gz”);dataFolder = fullfile (downloadFolder,“cifar-10-batches-mat”);如果~存在(dataFolder“dir”)流(“下载CIFAR-10数据集(175 MB)…”);websave(文件名、url);解压(文件名,downloadFolder);流(“完成。\ n”)结束

将数据转换成数值型数组使用helper函数loadCIFARData使用的例子火车残余网络图像分类。要访问这个函数,打开生活的脚本示例。

在媒介=目录(fullfile (matlabroot“例子”,“nnet”,“主要”));[XTrain, YTrain XValidation YValidation] = loadCIFARData (downloadFolder);

为一个例子,演示如何处理这些数据深度学习,明白了火车残余网络图像分类。

恢复路径,使用路径函数。

路径(媒介);

图像分类

MathWorks^®营销上

MathWorks营销数据集是一个小数据集包含75的图像MathWorks商品,属于五个不同的类(帽,多维数据集,打牌,螺丝刀,火炬)。您可以使用此数据集尝试转移迅速学习和图像分类。

大小的图像是227 - 227 - 3。

提取MathWorks营销数据集。

文件名=“MerchData.zip”;dataFolder = fullfile (tempdir,“MerchData”);如果~存在(dataFolder“dir”解压缩(文件名,tempdir);结束

加载数据作为一个图像数据存储使用imageDatastore功能和指定包含图像数据的文件夹。

imd = imageDatastore (dataFolder,…“IncludeSubfolders”,真的,“LabelSource”,“foldernames”);

示例显示了如何处理这些数据的深度学习,明白了学习开始转移和火车深入学习网络对新图像进行分类。

图像分类

CamVid

CamVid数据集是一组图像包含街道视图获得汽车驱动[8]。数据集是用于训练网络执行的语义分割图像和提供了32进行像素级标签语义类,包括车,行人,路。

大小的图像是720 - 960 - 3。

下载并提取CamVid数据集http://web4.cs.ucl.ac.uk/staff/g.brostow/MotionSegRecData/。数据集是关于573 MB。集downloadFolder数据的位置。

downloadFolder = tempdir;url =“http://web4.cs.ucl.ac.uk/staff/g.brostow/MotionSegRecData”urlImages = url +“/文件/ 701 _stillsraw_full.zip”;urlLabels = url +“/数据/ LabeledApproved_full.zip”;dataFolder = fullfile (downloadFolder,“CamVid”);dataFolderImages = fullfile (dataFolder,“图片”);dataFolderLabels = fullfile (dataFolder,“标签”);filenameLabels = fullfile (dataFolder,“labels.zip”);filenameImages = fullfile (dataFolder,“images.zip”);如果~存在(filenameLabels“文件”)| | ~存在(imagesZip“文件”mkdir (dataFolder)流(“下载CamVid图像数据集(557 MB)…”);websave (filenameImages urlImages);解压缩(filenameImages dataFolderImages);流(“完成。\ n”)流(“下载CamVid数据集标签(16 MB)…”);websave (filenameLabels urlLabels);解压缩(filenameLabels dataFolderLabels);流(“完成。\ n”)结束

加载数据作为一个像素标签数据存储使用pixelLabelDatastore函数包含标签数据,并指定文件夹类,标签id。使训练更容易,集团的一些原始类减少从32到11类的数量。标签标识,使用helper函数camvidPixelLabelIDs使用的例子语义分割使用深度学习。要访问这个函数,打开生活的脚本示例。

在媒介=目录(fullfile (matlabroot“例子”,“deeplearning_shared”,“主要”));imd = imageDatastore (dataFolderImages,“IncludeSubfolders”,真正的);类= [“天空”“建筑”“极”“路”“路面”“树”…“SignSymbol”“篱笆”“汽车”“行人”“自行车”];labelIDs = camvidPixelLabelIDs;pxds = pixelLabelDatastore (dataFolderLabels、类labelIDs);

为一个例子,演示如何处理这些数据深度学习,明白了语义分割使用深度学习。

恢复路径,使用路径函数。

路径(媒介);

语义分割

车辆

295年的车辆数据集由图像包含一个或两个标记的实例。这个小数据集用于探索YOLO-v2训练过程,但在实践中,需要更多的标签图片来训练一个健壮的探测器。

大小的图像是720 - 960 - 3。

提取车辆数据集。dataFolder数据的位置。

文件名=“vehicleDatasetImages.zip”;dataFolder = fullfile (tempdir,“vehicleImages”);如果~存在(dataFolder“dir”解压缩(文件名,tempdir);结束

加载数据集作为一个表的文件名和边界框提取垫文件和文件名转换为绝对的文件路径。

data =负载(“vehicleDatasetGroundTruth.mat”);vehicleDataset = data.vehicleDataset;vehicleDataset。imageFilename = fullfile (tempdir vehicleDataset.imageFilename);

创建一个图像数据存储包含图片和一盒标签包含边界框使用的数据存储imageDatastore和boxLabelDatastore函数,分别。结合生成的数据存储使用结合函数。

filenamesImages = vehicleDataset.imageFilename;tblBoxes = vehicleDataset (:,“汽车”);imd = imageDatastore (filenamesImages);建筑物= boxLabelDatastore (tblBoxes);cd =结合(imd,建筑物);

为一个例子,演示如何处理这些数据深度学习,明白了对象检测使用YOLO v2意思深入学习。

对象检测

RIT-18

航拍照片哈姆林海滩国家公园有彩色像素标签覆盖表明地区草地,树木,沙滩,沥青和其他类”height=

RIT-18数据集包含了图像数据被一架无人机在哈姆林海滩州立公园在纽约州[9]。数据包含标签的训练、验证和测试集,包括18个对象类标签路标,树,建筑。数据集是关于3 GB。

下载RIT-18数据集https://home.cis.rit.edu/ cnspci /其他/数据/ rit18_data.mat。集downloadFolder数据的位置。

downloadFolder = tempdir;url =“https://home.cis.rit.edu/ cnspci /其他/数据/ rit18_data.mat ';文件名= fullfile (downloadFolder,“rit18_data.mat”);如果~存在(文件名,“文件”)流(“下载哈姆林海滩的数据集(3 GB)…”);websave(文件名、url);流(“完成。\ n”)结束

为一个例子,演示如何处理这些数据深度学习,明白了多光谱图像的语义分割使用深度学习。

语义分割

有钱的孩子

轴向片人类大脑有彩色像素标签叠加显示区域的正常组织和肿瘤组织”height=

小鬼数据集包含了脑部肿瘤的MRI扫描,即神经胶质瘤,这是最常见的原发性脑恶性肿瘤[10]。

数据集包含750个4 - d卷,每个代表一个堆栈的3 d图像。每个4 d体积大小240 - - 240 - 155 - 4,在前三个维度对应高度,宽度和深度的三维体积的形象。第四维对应于不同的扫描方式。484数据集分为训练与体元标签和266个测试卷卷。数据集是关于7 GB。

创建一个目录来存储小鬼数据集。

dataFolder = fullfile (tempdir,“小鬼”);如果~存在(dataFolder“dir”mkdir (dataFolder);结束

下载的小鬼数据医学分割十项全能通过单击“下载数据”链接。下载“Task01_BrainTumour。焦油”文件。

TAR文件提取到指定的目录dataFolder变量。那么,如果提取成功dataFolder包含一个目录命名Task01_BrainTumour这有三个子目录:imagesTr,imagesTs,labelsTr。

为一个例子,演示如何处理这些数据深度学习,明白了三维大脑肿瘤分割使用深度学习。

语义分割

Camelyon16

正常组织样本的六个补丁”height=

Camelyon16挑战的数据包含400张幻灯片图片(WSIs)淋巴结从两个独立的来源,分为270 130训练图像和测试图像[11]。数据集是451 GB。

训练数据集包含159 WSIs的正常淋巴结和111 WSIs淋巴结的肿瘤组织和健康组织。通常,肿瘤组织的一小部分健康的组织。地面实况病变边界伴随肿瘤图像的坐标。

创建目录来存储Camelyon16数据集。

dataFolderTrain = fullfile (tempdir,“Camelyon16”,“培训”);dataFolderNormalTrain = fullfile (dataFolderTrain,“正常”);dataFolderTumorTrain = fullfile (dataFolderTrain,“肿瘤”);dataFolderAnnotationsTrain = fullfile (dataFolderTrain,“lesion_annotations”);如果~存在(dataFolderTrain“dir”mkdir (dataFolderTrain);mkdir (dataFolderNormalTrain);mkdir (dataFolderTumorTrain);mkdir (dataFolderAnnotationsTrain);结束

下载Camelyon16数据集Camelyon17点击第一个“CAMELYON16数据集”链接。打开“培训”目录中,然后按照以下步骤:

下载“lesion_annotations。邮政”文件。提取文件到指定的目录dataFolderAnnotationsTrain变量。
打开“正常”的目录。图片下载到指定的目录dataFolderNormalTrain变量。
打开“肿瘤”目录。图片下载到指定的目录dataFolderTumorTrain变量。

为一个例子,演示如何处理这些数据深度学习,明白了预处理多分辨率图像进行训练分类网络(图像处理工具箱)。

图像分类(大图片)

常见的对象上下文(可可)

(代表)

可可2014训练图像数据集包含82783张图片。注释数据包含至少五个标题对应每个图像。

创建目录来存储可可数据集。

dataFolder = fullfile (tempdir,“可可”);如果~存在(dataFolder“dir”mkdir (dataFolder);结束

下载并提取可可2014训练图像和字幕https://cocodataset.org/下载通过单击“2014训练图像”和“2014火车/ Val注释”链接,分别。数据保存在指定的文件夹dataFolder。

从文件中提取标题captions_train2014.json使用jsondecode函数。

文件名= fullfile (dataFolder,“annotations_trainval2014”,“注释”,…“captions_train2014.json”);str = fileread(文件名);data = jsondecode (str);

的注释结构的字段包含图像字幕所需的数据。

为一个例子,演示如何处理这些数据深度学习,明白了图像字幕使用注意。

图像字幕

IAPR TC-12

城堡的墙和花园在塞维利亚王宫,西班牙”height=

(代表)

的IAPR TC-12基准由20000名仍然自然图像[14]。数据集包括照片的人、动物、城市、和更多。数据文件大约是1.8 GB。

下载IAPR TC-12数据集。

dataDir = fullfile (tempdir,“iaprtc12”);url =“http://www-i6.informatik.rwth-aachen.de/imageclef/resources/iaprtc12.tgz”;如果~存在(dataDir“dir”)流(“下载IAPR TC-12数据集(1.8 GB)…\ n ');试一试解压(url, dataDir);抓%在一些Windows机器上,将命令解压. tgz抛出一个错误%的文件。重命名.tg并再试一次。文件名= fullfile (tempdir,“iaprtc12.tg”);websave(文件名、url);解压(文件名,dataDir);结束流(“做。\ n \ n”);结束

加载数据作为一个图像数据存储使用imageDatastore函数。指定包含图像数据的文件夹和文件扩展名。

imageDir = fullfile (dataDir,“图片”)ext = {“jpg”,bmp格式的,“使用”};imd = imageDatastore (imageDir,…“IncludeSubfolders”,真的,“FileExtensions”ext);

为一个例子,演示如何处理这些数据深度学习,明白了使用深度学习提高图像分辨率。

Image-to-image回归

苏黎世原始RGB

把原始和RGB图像补丁的苏黎世的街景”height=

苏黎世原始RGB数据集包含48043注册对原始和RGB空间训练图像补丁的大小448 - - 448[15]。数据集包含两个单独的测试集。一个测试集由1204空间注册对原始和RGB图像补丁的大小448 - - 448。未登记的全分辨率的其他测试集由原始和RGB图像。数据集是22 GB。

创建一个目录来存储苏黎世原始RGB数据集。

imageDir = fullfile (tempdir,“ZurichRAWToRGB”);如果~存在(imageDir“dir”mkdir (imageDir);结束

下载的数据集,请求访问使用苏黎世原始RGB数据集的形式。提取数据到指定的目录imageDir变量。那么,如果提取成功imageDir包含三个目录:full_resolution,测试,火车。< p >

为一个例子,演示如何处理这些数据深度学习,明白了使用深度学习开发相机处理管道。

Image-to-image回归

早已应用(SID)

对严重曝光不足和良好的曝光图像”height=

(SID)早已应用数据集提供了注册对原始图像相同的场景[16]。在每一对,一个图像有一个短的曝光时间和曝光不足,而另一个图像曝光时间较长,是良好的曝光。索尼相机数据的大小SID 25 GB的数据集。

指定dataDir的期望位置数据。

dataDir = fullfile (tempdir,“席德”);如果~存在(dataDir“dir”mkdir (dataDir);结束

下载的数据集,点击这个链接:https://storage.googleapis.com/isl-datasets/SID/Sony.zip。提取数据到指定的目录dataDir变量。当提取成功,dataDir包含目录索尼有两个子目录:长和短。中的文件长子目录中有一个长时间的曝光,良好的曝光。中的文件短子目录中有一个短的曝光和曝光不足和黑暗。

数据集还提供了文本文件,描述如何分区的文件到训练、验证和测试数据集。“Sony_train_list移动文件。txt”、“Sony_val_list。txt”,和“Sony_test_list。txt”指定的目录dataDir变量。

为一个例子,演示如何处理这些数据深度学习,明白了照亮极其黑暗的图片使用深度学习。

Image-to-image回归

生活在野外

三个不同的图像质量,平均值和标准devation主观质量分数”height=

生活在野外的数据集包含1162张照片被移动设备,有七个额外的培训图片[17]。平均每个图像是额定175人规模的[100]。数据集提供了主观评分的平均值和标准偏差为每个图像。

指定imageDir的期望位置数据。

imageDir = fullfile (tempdir,“LIVEInTheWild”);如果~存在(imageDir“dir”mkdir (imageDir);结束

下载数据集按照说明书中列出生活在野外数据库图像质量的挑战。提取数据到指定的目录imageDir变量。当提取成功,imageDir包含两个目录:数据和图片。

为一个例子,演示如何处理这些数据深度学习,明白了使用神经图像量化图像质量评估。

图像分类

混凝土裂缝图像的分类

图片没有和裂缝的混凝土。”height=

混凝土裂缝图像分类数据集包含图像的两类:“负面”的图像,没有裂缝出现在道路与裂缝和“积极”的图像[18][19]。每个类的数据集提供了20000张图片。数据集的大小是235 MB。

指定dataDir的期望位置数据。

dataDir = fullfile (tempdir,“ConcreteCracks”);如果~存在(dataDir“dir”mkdir (dataDir);结束

下载的数据集,点击这个链接:混凝土裂缝图像的分类。提取获得RAR文件的ZIP文件,然后提取RAR文件的内容到指定的目录dataDir变量。那么,如果提取成功dataDir包含两个子目录:负和积极的。

为一个例子,演示如何处理这些数据深度学习,明白了嵌入的图像异常检测使用Pretrained ResNet-18特性。

图像分类

米尔wm - 811 k(晶圆缺陷地图)

晶片的图像地图显示四种类型的缺陷”height=

晶圆缺陷地图数据集由811457片地图图片,其中包括172950标记图像[20][21]。每个图像只有三像素值。值0表示背景,值1代表正确表现死亡,和值2代表有缺陷的模具。9个标签的标签图像有一个基于空间模式的缺陷。数据集的大小是3.5 GB。

指定dataDir的期望位置数据,然后下载晶圆缺陷地图数据集。

dataDir = fullfile (tempdir,“WaferDefects”);dataURL =“http://mirlab.org/dataSet/public/MIR-WM811K.zip”;dataMatFile = fullfile (dataDir,“MIR-WM811K”,“MATLAB”,“WM811K.mat”);如果存在(dataMatFile“文件”)~ = 2解压(dataURL dataDir);结束

数据存储在一个垫子文件作为一个结构数组。数据集加载到工作区。

waferData =负载(dataMatFile);waferData = waferData.data;

为一个例子,演示如何处理这些数据深度学习,明白了使用深度学习分类异常在晶圆缺陷地图。

图像分类

丸质量控制(丸质量控制)

图像的一个正常的药丸,药丸与灰尘污染,和一颗药丸芯片缺陷”height=

避孕药质检数据集包含图像的三个类:“正常”的图片没有缺陷,“芯片”图像芯片缺陷药丸,和“污垢”图像与灰尘污染。43芯片数据集提供了149个常规的图像,图像,和138年污垢图像。数据集的大小是3.57 MB。

指定dataDir的期望位置数据,然后下载丸质量控制数据集。

dataDir = fullfile (tempdir,“PillDefects”);imageDir = fullfile (dataDir,“pillQC-main”);如果~存在(imageDir“dir”)解压缩(“https://github.com/matlab-deep-learning/pillQC/archive/refs/heads/main.zip”,dataDir);结束

加载数据作为一个图像数据存储使用imageDatastore功能和指定包含图像数据的文件夹。

imageDir = fullfile (dataDir,“pillQC-main”,“图片”);imd = imageDatastore (imageDir IncludeSubfolders = true, LabelSource =“foldernames”);

为一个例子,演示如何处理这些数据深度学习,明白了使用分类神经网络可辩解的看到下面成了图像异常检测。

图像分类

乳腺超声图像(商业)

超声波图像正常乳腺组织、良性肿瘤和恶性肿瘤”height=

乳腺超声图像(商业)数据集包含二维乳腺超声图像[22]。数据集包含133个正常图像,图像与良性肿瘤,487和210图像与恶性肿瘤。每个肿瘤超声图像有一个相应的语义分割掩模图像训练网络。肿瘤临床放射学家面具标签了。数据集的大小大约是197 MB。

从MathWorks网站下载商业数据集。

zipFile = matlab.internal.examples.download金宝appSupportFile (“图像”,“数据/ Dataset_BUSI.zip”);filepath = fileparts (zipFile);解压缩(zipFile filepath)

加载数据作为一个图像数据存储使用imageDatastore功能和品牌形象正常的,良性的,或恶性根据其文件夹的名称。

imageDir = fullfile (filepath,“Dataset_BUSI_with_GT”);imd = imageDatastore (imageDir IncludeSubfolders = true, LabelSource =“foldernames”);

为一个例子,演示如何处理这些数据深度学习,明白了从超声乳腺肿瘤分割使用深度学习。

语义分割

儿童和青少年神经发育倡议(候选材料)神经影像数据集

大脑的核磁共振图像分割的面具的大脑结构和地面真理”height=

候选材料的数据集(HC_001子集)包含一个大脑核磁共振图像体积和其相应的分割图像标签[23]。数据集的总大小是大约2.5 MB。

从MathWorks网站下载候选材料的数据集。

zipFile = matlab.internal.examples.download金宝appSupportFile (“图像”,“数据/ brainSegData.zip”);filepath = fileparts (zipFile);解压缩(zipFile filepath) dataDir = fullfile (filepath,“brainSegData”);

为一个例子,演示如何加载和处理这些数据深度学习,明白了大脑MRI分割使用Pretrained 3 d U-Net网络

语义分割

时间序列和信号数据集

数据描述任务

数据	描述	任务
日本的元音	日本元音数据集包含预处理序列代表日本元音的话语从不同的扬声器[24][25]。 `XTrain`和`XTest`细胞阵列包含维度12可变长度的序列。`YTrain`和`欧美`是分类向量的标签1到9,对应于九个扬声器。的条目`XTrain`与12矩阵行(每个特性的一行)和不同数量的列(每个时间步一列)。`XTest`是一个单元阵列包含370维度12可变长度的序列。日本元音数据加载设置为内存单元数组包含数字序列使用`japaneseVowelsTrainData`和`japaneseVowelsTestData`功能。 [XTrain, YTrain] = japaneseVowelsTrainData;[XTest,欧美]= japaneseVowelsTestData; 为一个例子,演示如何处理这些数据深度学习,明白了使用深度学习序列分类。	Sequence-to-label分类
水痘	水痘数据集包含一个时间序列,随着时间的推移步骤对应月和值对应于病例数量。输出是一个单元阵列,其中每个元素是一个时间步。加载水痘数据为一个单一的数字序列使用`chickenpox_dataset`函数。重塑一个行向量数据。数据= chickenpox_dataset;数据=({}):数据; 为一个例子,演示如何处理这些数据深度学习,明白了使用深度学习时间序列预测。	时间序列预测
人类活动	人类活动数据集包含7个传感器数据的时间序列来自智能手机戴在身体。每个序列有三个特性和不同长度。这三个特征对应于加速度计读数在三个不同的方向。载入人类活动数据集。 dataTrain =负载(“HumanActivityTrain”);人数(=负载(“HumanActivityTest”);XTrain = dataTrain.XTrain;YTrain = dataTrain.YTrain;XTest = dataTest.XTest;欧美= dataTest.YTest; 为一个例子,演示如何处理这些数据深度学习,明白了使用深度学习Sequence-to-Sequence分类。	Sequence-to-sequence分类
涡扇发动机退化模拟	涡扇发动机的每个时间序列退化模拟数据集代表一个不同的引擎[26]。每个引擎从开始未知程度的磨损和制造变化。引擎操作通常在每个时间序列的开始,并开发一个错误在某种程度上在系列。在训练集,断层生长在级到系统故障。数据包含一个zip压缩文本文件与26列的数字,用空格分开。每一行是一个快照的数据在一个运行周期,每一列是一个不同的变量。列对应如下: 列1 -单元号列2 -时间周期列3 - 5——操作设置列6-26——传感器测量1日到21日创建一个目录来存储涡扇发动机退化模拟数据集。 dataFolder = fullfile (tempdir,“涡扇”);如果~存在(dataFolder“dir”mkdir (dataFolder);结束下载并提取涡扇发动机退化模拟数据集。文件名= matlab.internal.examples.downloadSuppor金宝apptFile (…“nnet”,“数据/ TurbofanEngineDegradationSimulationData.zip”);解压缩(文件名,dataFolder) 负荷训练和测试数据使用辅助函数`processTurboFanDataTrain`和`processTurboFanDataTest`,分别。使用这些函数的例子使用深度学习Sequence-to-Sequence回归。要访问这些功能,打开生活的脚本示例。在媒介=目录(fullfile (matlabroot“例子”,“nnet”,“主要”));filenamePredictors = fullfile (dataFolder,“train_FD001.txt”);[XTrain, YTrain] = processTurboFanDataTrain (filenamePredictors);filenamePredictors = fullfile (dataFolder,“test_FD001.txt”);filenameResponses = fullfile (dataFolder,“RUL_FD001.txt”);[XTest,欧美]= processTurboFanDataTest (filenamePredictors filenameResponses); 为一个例子,演示如何处理这些数据深度学习,明白了使用深度学习Sequence-to-Sequence回归。恢复路径,使用`路径`函数。路径(媒介);	Sequence-to-sequence回归,预测性维护
生理网2017年挑战	生理网2017年挑战数据集由一组心电图(ECG)录音采样在300赫兹,由一群专家分为不同的类[28]。下载并提取数据集使用的生理网2017年挑战`ReadPhysionetData`脚本,用于示例使用长短期记忆网络的ECG信号进行分类。要访问这个函数,打开生活的脚本示例。数据集是95 MB。在媒介=目录(fullfile (matlabroot“例子”,“deeplearning_shared”,“主要”));ReadPhysionetData data =负载(“PhysionetData.mat”)信号= data.Signals;标签= data.Labels; 为一个例子,演示如何处理这些数据深度学习,明白了使用长短期记忆网络的ECG信号进行分类。恢复路径,使用`路径`函数。路径(媒介);	Sequence-to-label分类
田纳西伊士曼过程(TEP)模拟	这个数据集包括垫文件从田纳西伊士曼转换过程(TEP)模拟数据[27]。下载田纳西伊士曼过程(TEP)模拟数据集从MathWorks支持站点(见文件金宝app免责声明)。数据集有四个组成部分:无故障的培训,绝对没错的测试,错误的训练,和错误的测试。每个文件单独下载。数据集是1.7 GB。流(“TEP错误的训练数据下载(613 MB)……”)filenameFaultyTrain = matlab.internal.examples.downloadS金宝appupportFile (“predmaint”,…“chemical-process-fault-detection-data / faultytraining.mat”);流(“完成。\ n”)流(“下载TEP错误的测试数据(1 GB)……”)filenameFaultyTest = matlab.internal.examples.downloadS金宝appupportFile (“predmaint”,…“chemical-process-fault-detection-data / faultytesting.mat”);流(“完成。\ n”)流(“下载TEP无故障的训练数据(36 MB)……”)filenameFaultFreeTrain = matlab.internal.examples.downloadS金宝appupportFile (“predmaint”,…“chemical-process-fault-detection-data / faultfreetraining.mat”);流(“完成。\ n”)流(“下载TEP无故障的测试数据(69 MB)……”)filenameFaultFreeTest = matlab.internal.examples.downloadS金宝appupportFile (“predmaint”,…“chemical-process-fault-detection-data / faultfreetesting.mat”);流(“完成。\ n”) 下载的文件加载到MATLAB^®工作区。负载(filenameFaultyTrain);负载(filenameFaultyTest);负载(filenameFaultFreeTrain);负载(filenameFaultFreeTest); 为一个例子,演示如何处理这些数据深度学习,明白了使用深度学习化工过程故障检测。	Sequence-to-label分类
生理网心电图分割	生理网心电图分类数据集包含大约15分钟共有105名患者的心电图记录[28][29]。获得每个记录,审查员把两个电极放在不同的位置在一个病人的胸部,导致双通道信号。数据库提供了信号区域标签由一个自动生成专家系统。生理网下载心电图细分的数据集https://github.com/mathworks/physionet_ECG_segmentation通过下载的ZIP文件`QT_Database-master.zip`。数据集是72 MB。集合`downloadFolder`数据的位置。 downloadFolder = tempdir;url =“https://github.com/mathworks/physionet_ECG_segmentation/raw/master/QT_Database-master.zip”;文件名= fullfile (downloadFolder,“QT_Database-master.zip”);dataFolder = fullfile (downloadFolder,“QT_Database-master”);如果~存在(dataFolder“dir”)流(生理网”下载心电图分类数据集(72 MB)…”)websave(文件名,url);解压缩(文件名,downloadFolder);流(“完成。\ n”)结束解创建文件夹`QT_Database-master`在你的临时目录中。这个文件夹包含的文本文件`README.md`和下列文件: `QTData.mat` `Modified_physionet_data.txt` `License.txt` `QTData.mat`包含生理网心电图细分数据。该文件`Modified_physionet_data.txt`提供了数据和源归因的描述操作应用到每个原始心电图记录。加载生理网垫心电图分割数据文件。负载(fullfile (dataFolder“QTData.mat”)) 为一个例子,演示如何处理这些数据深度学习,明白了波形分割使用深度学习。	Sequence-to-label分类、波形分割
合成行人、汽车和自行车反向散射	生成一个合成行人、汽车和自行车反向散射数据集使用辅助函数`helperBackScatterSignals`和`helperDopplerSignatures`使用的例子行人和自行车使用深度学习分类(雷达工具箱)。辅助函数`helperBackScatterSignals`生成指定数量的行人、骑自行车和汽车雷达的回报。对于每一个实现,返回信号维度N在- - - - - -N缓慢的,N快的数量夏令时间样品和N缓慢的数量标准时间样本。辅助函数`helperDopplerSignatures`计算短时傅里叶变换)生成微多普勒雷达回波的签名。要获得微多普勒特征,使用辅助函数应用STFT和每个信号预处理方法。要访问这些功能,打开生活的脚本示例。在媒介=目录(fullfile (matlabroot“例子”,“分阶段”,“主要”));numPed = 1;%的行人数量实现numBic = 1;%的自行车数量实现numCar = 1;%的数量汽车实现[xPedRec, xBicRec xCarRec Tsamp] = helperBackScatterSignals (numPed, numBic numCar);(加速、T、F) = helperDopplerSignatures (xPedRec Tsamp);[SBic, ~, ~] = helperDopplerSignatures (xBicRec Tsamp);[伤疤,~,~]= helperDopplerSignatures (xCarRec Tsamp); 为一个例子,演示如何处理这些数据深度学习,明白了行人和自行车使用深度学习分类(雷达工具箱)。恢复路径,使用`路径`函数。路径(媒介);	Sequence-to-label分类
生成的波形	生成矩形,线性调频、相位编码使用helper函数波形`helperGenerateRadarWaveforms`使用的例子雷达和通讯波形分类使用深度学习(雷达工具箱)。辅助函数`helperGenerateRadarWaveforms`产生3000信号的采样率为每个调制类型使用100 MHz`phased.RectangularWaveform`对于矩形脉冲,`phased.LinearFMWaveform`线性调频,`phased.PhaseCodedWaveform`相跟巴克码脉冲。要访问这些功能,打开生活的脚本示例。在媒介=目录(fullfile (matlabroot“例子”,“分阶段”,“主要”));[wav, modType] = helperGenerateRadarWaveforms; 为一个例子,演示如何处理这些数据深度学习,明白了雷达和通讯波形分类使用深度学习(雷达工具箱)。恢复路径,使用`路径`函数。路径(媒介);	Sequence-to-label分类

日本的元音

日本元音数据集包含预处理序列代表日本元音的话语从不同的扬声器[24][25]。

XTrain和XTest细胞阵列包含维度12可变长度的序列。YTrain和欧美是分类向量的标签1到9,对应于九个扬声器。的条目XTrain与12矩阵行(每个特性的一行)和不同数量的列(每个时间步一列)。XTest是一个单元阵列包含370维度12可变长度的序列。

日本元音数据加载设置为内存单元数组包含数字序列使用japaneseVowelsTrainData和japaneseVowelsTestData功能。

[XTrain, YTrain] = japaneseVowelsTrainData;[XTest,欧美]= japaneseVowelsTestData;

为一个例子,演示如何处理这些数据深度学习,明白了使用深度学习序列分类。

Sequence-to-label分类

水痘

水痘数据集包含一个时间序列,随着时间的推移步骤对应月和值对应于病例数量。输出是一个单元阵列,其中每个元素是一个时间步。

加载水痘数据为一个单一的数字序列使用chickenpox_dataset函数。重塑一个行向量数据。

数据= chickenpox_dataset;数据=({}):数据;

为一个例子,演示如何处理这些数据深度学习,明白了使用深度学习时间序列预测。

时间序列预测

人类活动

人类活动数据集包含7个传感器数据的时间序列来自智能手机戴在身体。每个序列有三个特性和不同长度。这三个特征对应于加速度计读数在三个不同的方向。

载入人类活动数据集。

dataTrain =负载(“HumanActivityTrain”);人数(=负载(“HumanActivityTest”);XTrain = dataTrain.XTrain;YTrain = dataTrain.YTrain;XTest = dataTest.XTest;欧美= dataTest.YTest;

为一个例子,演示如何处理这些数据深度学习,明白了使用深度学习Sequence-to-Sequence分类。

Sequence-to-sequence分类

涡扇发动机退化模拟

涡扇发动机的每个时间序列退化模拟数据集代表一个不同的引擎[26]。每个引擎从开始未知程度的磨损和制造变化。引擎操作通常在每个时间序列的开始,并开发一个错误在某种程度上在系列。在训练集,断层生长在级到系统故障。

数据包含一个zip压缩文本文件与26列的数字,用空格分开。每一行是一个快照的数据在一个运行周期,每一列是一个不同的变量。列对应如下:

列1 -单元号
列2 -时间周期
列3 - 5——操作设置
列6-26——传感器测量1日到21日

创建一个目录来存储涡扇发动机退化模拟数据集。

dataFolder = fullfile (tempdir,“涡扇”);如果~存在(dataFolder“dir”mkdir (dataFolder);结束

下载并提取涡扇发动机退化模拟数据集。

文件名= matlab.internal.examples.downloadSuppor金宝apptFile (…“nnet”,“数据/ TurbofanEngineDegradationSimulationData.zip”);解压缩(文件名,dataFolder)

负荷训练和测试数据使用辅助函数processTurboFanDataTrain和processTurboFanDataTest,分别。使用这些函数的例子使用深度学习Sequence-to-Sequence回归。要访问这些功能,打开生活的脚本示例。

在媒介=目录(fullfile (matlabroot“例子”,“nnet”,“主要”));filenamePredictors = fullfile (dataFolder,“train_FD001.txt”);[XTrain, YTrain] = processTurboFanDataTrain (filenamePredictors);filenamePredictors = fullfile (dataFolder,“test_FD001.txt”);filenameResponses = fullfile (dataFolder,“RUL_FD001.txt”);[XTest,欧美]= processTurboFanDataTest (filenamePredictors filenameResponses);

为一个例子,演示如何处理这些数据深度学习,明白了使用深度学习Sequence-to-Sequence回归。

恢复路径,使用路径函数。

路径(媒介);

Sequence-to-sequence回归,预测性维护

生理网2017年挑战

生理网2017年挑战数据集由一组心电图(ECG)录音采样在300赫兹,由一群专家分为不同的类[28]。

下载并提取数据集使用的生理网2017年挑战ReadPhysionetData脚本,用于示例使用长短期记忆网络的ECG信号进行分类。要访问这个函数,打开生活的脚本示例。数据集是95 MB。

在媒介=目录(fullfile (matlabroot“例子”,“deeplearning_shared”,“主要”));ReadPhysionetData data =负载(“PhysionetData.mat”)信号= data.Signals;标签= data.Labels;

为一个例子,演示如何处理这些数据深度学习,明白了使用长短期记忆网络的ECG信号进行分类。

恢复路径,使用路径函数。

路径(媒介);

Sequence-to-label分类

田纳西伊士曼过程(TEP)模拟

这个数据集包括垫文件从田纳西伊士曼转换过程(TEP)模拟数据[27]。

下载田纳西伊士曼过程(TEP)模拟数据集从MathWorks支持站点(见文件金宝app免责声明)。数据集有四个组成部分:无故障的培训,绝对没错的测试,错误的训练,和错误的测试。每个文件单独下载。

数据集是1.7 GB。

流(“TEP错误的训练数据下载(613 MB)……”)filenameFaultyTrain = matlab.internal.examples.downloadS金宝appupportFile (“predmaint”,…“chemical-process-fault-detection-data / faultytraining.mat”);流(“完成。\ n”)流(“下载TEP错误的测试数据(1 GB)……”)filenameFaultyTest = matlab.internal.examples.downloadS金宝appupportFile (“predmaint”,…“chemical-process-fault-detection-data / faultytesting.mat”);流(“完成。\ n”)流(“下载TEP无故障的训练数据(36 MB)……”)filenameFaultFreeTrain = matlab.internal.examples.downloadS金宝appupportFile (“predmaint”,…“chemical-process-fault-detection-data / faultfreetraining.mat”);流(“完成。\ n”)流(“下载TEP无故障的测试数据(69 MB)……”)filenameFaultFreeTest = matlab.internal.examples.downloadS金宝appupportFile (“predmaint”,…“chemical-process-fault-detection-data / faultfreetesting.mat”);流(“完成。\ n”)

下载的文件加载到MATLAB^®工作区。

负载(filenameFaultyTrain);负载(filenameFaultyTest);负载(filenameFaultFreeTrain);负载(filenameFaultFreeTest);

为一个例子,演示如何处理这些数据深度学习,明白了使用深度学习化工过程故障检测。

Sequence-to-label分类

生理网心电图分割

生理网心电图分类数据集包含大约15分钟共有105名患者的心电图记录[28][29]。获得每个记录,审查员把两个电极放在不同的位置在一个病人的胸部,导致双通道信号。数据库提供了信号区域标签由一个自动生成专家系统。

生理网下载心电图细分的数据集https://github.com/mathworks/physionet_ECG_segmentation通过下载的ZIP文件QT_Database-master.zip。数据集是72 MB。集合downloadFolder数据的位置。

downloadFolder = tempdir;url =“https://github.com/mathworks/physionet_ECG_segmentation/raw/master/QT_Database-master.zip”;文件名= fullfile (downloadFolder,“QT_Database-master.zip”);dataFolder = fullfile (downloadFolder,“QT_Database-master”);如果~存在(dataFolder“dir”)流(生理网”下载心电图分类数据集(72 MB)…”)websave(文件名,url);解压缩(文件名,downloadFolder);流(“完成。\ n”)结束

解创建文件夹QT_Database-master在你的临时目录中。这个文件夹包含的文本文件README.md和下列文件:

QTData.mat
Modified_physionet_data.txt
License.txt

QTData.mat包含生理网心电图细分数据。该文件Modified_physionet_data.txt提供了数据和源归因的描述操作应用到每个原始心电图记录。加载生理网垫心电图分割数据文件。

负载(fullfile (dataFolder“QTData.mat”))

为一个例子,演示如何处理这些数据深度学习,明白了波形分割使用深度学习。

Sequence-to-label分类、波形分割

合成行人、汽车和自行车反向散射

生成一个合成行人、汽车和自行车反向散射数据集使用辅助函数helperBackScatterSignals和helperDopplerSignatures使用的例子行人和自行车使用深度学习分类(雷达工具箱)。

辅助函数helperBackScatterSignals生成指定数量的行人、骑自行车和汽车雷达的回报。对于每一个实现,返回信号维度N在- - - - - -N缓慢的,N快的数量夏令时间样品和N缓慢的数量标准时间样本。

辅助函数helperDopplerSignatures计算短时傅里叶变换)生成微多普勒雷达回波的签名。要获得微多普勒特征,使用辅助函数应用STFT和每个信号预处理方法。

要访问这些功能,打开生活的脚本示例。

在媒介=目录(fullfile (matlabroot“例子”,“分阶段”,“主要”));numPed = 1;%的行人数量实现numBic = 1;%的自行车数量实现numCar = 1;%的数量汽车实现[xPedRec, xBicRec xCarRec Tsamp] = helperBackScatterSignals (numPed, numBic numCar);(加速、T、F) = helperDopplerSignatures (xPedRec Tsamp);[SBic, ~, ~] = helperDopplerSignatures (xBicRec Tsamp);[伤疤,~,~]= helperDopplerSignatures (xCarRec Tsamp);

为一个例子,演示如何处理这些数据深度学习,明白了行人和自行车使用深度学习分类(雷达工具箱)。

恢复路径,使用路径函数。

路径(媒介);

Sequence-to-label分类

生成的波形

生成矩形,线性调频、相位编码使用helper函数波形helperGenerateRadarWaveforms使用的例子雷达和通讯波形分类使用深度学习(雷达工具箱)。

辅助函数helperGenerateRadarWaveforms产生3000信号的采样率为每个调制类型使用100 MHzphased.RectangularWaveform对于矩形脉冲,phased.LinearFMWaveform线性调频,phased.PhaseCodedWaveform相跟巴克码脉冲。

要访问这些功能,打开生活的脚本示例。

在媒介=目录(fullfile (matlabroot“例子”,“分阶段”,“主要”));[wav, modType] = helperGenerateRadarWaveforms;

为一个例子,演示如何处理这些数据深度学习,明白了雷达和通讯波形分类使用深度学习(雷达工具箱)。

恢复路径,使用路径函数。

路径(媒介);

Sequence-to-label分类

视频数据集

数据描述任务

数据	描述	任务
HMDB:一个巨大的人类运动数据库 (代表)	HMBD51数据集包含7000年大约2 GB的视频数据片段51类,如喝,运行,俯卧撑。下载并提取HMBD51数据集HMDB:一个巨大的人类运动数据库。数据集2 GB。 RAR文件,解压缩之后的文件名称和标签视频使用helper函数`hmdb51Files`使用的例子分类使用深度学习视频。集`dataFolder`数据的位置。要访问这个函数,打开生活的脚本示例。在媒介=目录(fullfile (matlabroot“例子”,“nnet”,“主要”));dataFolder = fullfile (tempdir,“hmdb51_org”);(文件、标签)= hmdb51Files (dataFolder); 为一个例子,演示如何处理这些数据深度学习,明白了分类使用深度学习视频。恢复路径,使用`路径`函数。路径(媒介);	视频分类

HMDB:一个巨大的人类运动数据库

(代表)

HMBD51数据集包含7000年大约2 GB的视频数据片段51类,如喝,运行,俯卧撑。

下载并提取HMBD51数据集HMDB:一个巨大的人类运动数据库。数据集2 GB。

RAR文件,解压缩之后的文件名称和标签视频使用helper函数hmdb51Files使用的例子分类使用深度学习视频。集dataFolder数据的位置。要访问这个函数,打开生活的脚本示例。

在媒介=目录(fullfile (matlabroot“例子”,“nnet”,“主要”));dataFolder = fullfile (tempdir,“hmdb51_org”);(文件、标签)= hmdb51Files (dataFolder);

为一个例子,演示如何处理这些数据深度学习,明白了分类使用深度学习视频。

恢复路径,使用路径函数。

路径(媒介);

视频分类

文本数据集

数据描述任务

数据	描述	任务
工厂的报告	工厂报告数据集是一个表,它包含大约500报告的各种属性包括纯文本描述变量`描述`和一个分类标签变量`类别`。从文件读取工厂报告数据`“factoryReports.csv”`。提取的文本数据和标签`描述`和`类别`分别列。文件名=“factoryReports.csv”;data = readtable(文件名,“TextType”,“字符串”);textData = data.Description;标签= data.Category; 为一个例子,演示如何处理这些数据深度学习,明白了使用深度学习分类文本数据。	文本分类、主题建模
莎士比亚的十四行诗	该文件`sonnets.txt`包含所有莎士比亚的十四行诗在一个文本文件。读了莎士比亚的十四行诗的数据文件`“sonnets.txt”`。文件名=“sonnets.txt”;textData = fileread(文件名); 十四行诗是缩进两个空格字符和由两个换行符。消除压痕使用`取代`和文本分割成单独的十四行诗`分裂`。删除主标题的前三个元素和十四行诗的标题,它出现在每个十四行诗。 textData =取代(textData,”“,”“);textData =分裂(textData(换行换行));textData = textData(5:2:结束); 为一个例子,演示如何处理这些数据深度学习,明白了生成文本使用深度学习。	主题建模、文本生成
ArXiv的元数据	ArXiv API允许您访问科学发展的元数据提交https://arxiv.org包括抽象和主题领域。有关更多信息,请参见https://arxiv.org/help/api。导入一组抽象和分类标签从数学论文使用arXiV API。 url =“https://export.arxiv.org/oai2?verb=ListRecords”+…“集=数学”+…“&metadataPrefix = arXiv”;选择= weboptions (“超时”,160);代码= webread (url选项); 为例展示如何解析返回的XML代码和进口更多的记录,知道了使用深度学习Multilabel文本分类。	文本分类、主题建模
书从古登堡计划	你可以从古腾堡计划那里下载很多书。例如,下载文本从刘易斯·卡罗尔的《爱丽丝漫游奇境记》中https://www.gutenberg.org/files/11/11-h/11-h.htm使用`webread`函数。 url =“https://www.gutenberg.org/files/11/11-h/11-h.htm”;代码= webread (url); 里面的HTML代码包含相关的文本`< p >`(段落)元素。提取相关的文本通过解析HTML代码使用`htmlTree`函数,然后找到所有元素的元素名称`“p”`。树= htmlTree(代码);选择器=“p”;子树= findElement(树,选择器); 从HTML子树中提取文本数据使用`extractHTMLText`函数和删除空元素。 textData = extractHTMLText(子树);textData (textData = =”“)= []; 为一个例子,演示如何处理这些数据深度学习,明白了词词文本生成使用深度学习。	主题建模、文本生成
周末更新	该文件`weekendUpdates.xlsx`包含示例社交媒体状态更新包含标签“#周末”和“#假期”。这个数据集需要文本分析工具箱™。从文件中提取文本数据`weekendUpdates.xlsx`使用`readtable`功能和从变量中提取文本数据`TextData`。文件名=“weekendUpdates.xlsx”;台= readtable(文件名,“TextType”,“字符串”);textData = tbl.TextData; 对于一个例子,演示如何处理这些数据,看看在文本分析情绪(文本分析工具箱)。	情绪分析
罗马数字	CSV文件`“romanNumerals.csv”`包含小数1 - 1000在第一列和第二列对应的罗马数字。加载decimal-Roman数字双从CSV文件`“romanNumerals.csv”`。文件名= fullfile (“romanNumerals.csv”);选择= detectImportOptions(文件名,…“TextType”,“字符串”,…“ReadVariableNames”、假);选项。VariableNames = [“源”“目标”];选项。VariableTypes = [“字符串”“字符串”];data = readtable(文件名,选择); 为一个例子,演示如何处理这些数据深度学习,明白了Sequence-to-Sequence翻译使用注意。	Sequence-to-sequence翻译
财务报告	美国证券交易委员会(SEC)允许您访问财务报表通过电子数据收集、分析和检索(埃德加)API。有关更多信息,请参见https://www.sec.gov/os/accessing-edgar-data。下载这些数据,使用该函数`financeReports`附加的例子生成特定领域情感词典(文本分析工具箱)作为支持文金宝app件。要访问这个函数,打开生活的脚本示例。年= 2019;季度= 4;最大长度= 2 e6;textData = financeReports(年、季度、最大长度); 对于一个例子,演示如何处理这些数据,看看生成特定领域情感词典(文本分析工具箱)。	情绪分析

工厂的报告

工厂报告数据集是一个表,它包含大约500报告的各种属性包括纯文本描述变量描述和一个分类标签变量类别。

从文件读取工厂报告数据“factoryReports.csv”。提取的文本数据和标签描述和类别分别列。

文件名=“factoryReports.csv”;data = readtable(文件名,“TextType”,“字符串”);textData = data.Description;标签= data.Category;

为一个例子,演示如何处理这些数据深度学习,明白了使用深度学习分类文本数据。

文本分类、主题建模

莎士比亚的十四行诗

该文件sonnets.txt包含所有莎士比亚的十四行诗在一个文本文件。

读了莎士比亚的十四行诗的数据文件“sonnets.txt”。

文件名=“sonnets.txt”;textData = fileread(文件名);

十四行诗是缩进两个空格字符和由两个换行符。消除压痕使用取代和文本分割成单独的十四行诗分裂。删除主标题的前三个元素和十四行诗的标题,它出现在每个十四行诗。

textData =取代(textData,”“,”“);textData =分裂(textData(换行换行));textData = textData(5:2:结束);

为一个例子,演示如何处理这些数据深度学习,明白了生成文本使用深度学习。

主题建模、文本生成

ArXiv的元数据

ArXiv API允许您访问科学发展的元数据提交https://arxiv.org包括抽象和主题领域。有关更多信息,请参见https://arxiv.org/help/api。

导入一组抽象和分类标签从数学论文使用arXiV API。

url =“https://export.arxiv.org/oai2?verb=ListRecords”+…“集=数学”+…“&metadataPrefix = arXiv”;选择= weboptions (“超时”,160);代码= webread (url选项);

为例展示如何解析返回的XML代码和进口更多的记录,知道了使用深度学习Multilabel文本分类。

文本分类、主题建模

书从古登堡计划

你可以从古腾堡计划那里下载很多书。例如,下载文本从刘易斯·卡罗尔的《爱丽丝漫游奇境记》中https://www.gutenberg.org/files/11/11-h/11-h.htm使用webread函数。

url =“https://www.gutenberg.org/files/11/11-h/11-h.htm”;代码= webread (url);

里面的HTML代码包含相关的文本< p >(段落)元素。提取相关的文本通过解析HTML代码使用htmlTree函数,然后找到所有元素的元素名称“p”。

树= htmlTree(代码);选择器=“p”;子树= findElement(树,选择器);

从HTML子树中提取文本数据使用extractHTMLText函数和删除空元素。

textData = extractHTMLText(子树);textData (textData = =”“)= [];

为一个例子,演示如何处理这些数据深度学习,明白了词词文本生成使用深度学习。

主题建模、文本生成

周末更新

该文件weekendUpdates.xlsx包含示例社交媒体状态更新包含标签“#周末”和“#假期”。这个数据集需要文本分析工具箱™。

从文件中提取文本数据weekendUpdates.xlsx使用readtable功能和从变量中提取文本数据TextData。

文件名=“weekendUpdates.xlsx”;台= readtable(文件名,“TextType”,“字符串”);textData = tbl.TextData;

对于一个例子,演示如何处理这些数据,看看在文本分析情绪(文本分析工具箱)。

情绪分析

罗马数字

CSV文件“romanNumerals.csv”包含小数1 - 1000在第一列和第二列对应的罗马数字。

加载decimal-Roman数字双从CSV文件“romanNumerals.csv”。

文件名= fullfile (“romanNumerals.csv”);选择= detectImportOptions(文件名,…“TextType”,“字符串”,…“ReadVariableNames”、假);选项。VariableNames = [“源”“目标”];选项。VariableTypes = [“字符串”“字符串”];data = readtable(文件名,选择);

为一个例子,演示如何处理这些数据深度学习,明白了Sequence-to-Sequence翻译使用注意。

Sequence-to-sequence翻译

财务报告

美国证券交易委员会(SEC)允许您访问财务报表通过电子数据收集、分析和检索(埃德加)API。有关更多信息,请参见https://www.sec.gov/os/accessing-edgar-data。

下载这些数据,使用该函数financeReports附加的例子生成特定领域情感词典(文本分析工具箱)作为支持文金宝app件。要访问这个函数,打开生活的脚本示例。

年= 2019;季度= 4;最大长度= 2 e6;textData = financeReports(年、季度、最大长度);

对于一个例子,演示如何处理这些数据,看看生成特定领域情感词典(文本分析工具箱)。

情绪分析

音频数据集

数据描述任务

数据	描述	任务
语音命令	语音命令数据集由大约65000个音频文件包括标有1的12类是的,没有,在,从,以及类对应于未知的命令和背景噪音[30]。下载并提取语音命令数据集https://storage.googleapis.com/download.tensorflow.org/data/speech_commands_v0.01.tar.gz。数据集是关于1.4 GB。集`dataFolder`数据的位置。使用`audioDatastore`创建一个数据存储包含文件名和相应的标签。 dataFolder = tempdir;广告= audioDatastore (dataFolder,…“IncludeSubfolders”,真的,…“FileExtensions”,“wav”,…“LabelSource”,“foldernames”); 为一个例子,演示如何处理这些数据深度学习,明白了使用深度学习训练语音命令识别模型。	音频分类、语音识别
Mozilla共同的声音	Mozilla常见语音数据集由录音讲话和对应的文本文件。数据还包括人口统计元数据,比如年龄和口音。下载并提取Mozilla常见语音数据集的数据集https://voice.mozilla.org/。是一个开放的数据集的数据集,这意味着它能随着时间的推移而增长。截至2019年10月,数据集是关于28 GB。集`dataFolder`数据的位置。使用`audioDatastore`创建一个数据存储包含文件名和相应的标签。 dataFolder = tempdir;广告= audioDatastore (fullfile (dataFolder,“剪辑”));	音频分类、语音识别。
免费使用数字数据集	免费使用数字数据集,2000年1月29日,2019年,由获得的英语数字0到9的录音从四个扬声器。两个扬声器的这个版本是美国英语和母语的非本地的两个喇叭扬声器分别与比利时法国和德国口音的英语。数据采样在8000赫兹。下载免费使用数字数据集(FSDD)录音https://github.com/Jakobovski/free-spoken-digit-dataset。集`dataFolder`数据的位置。使用`audioDatastore`创建一个数据存储包含文件名和相应的标签。 dataFolder = fullfile (tempdir,“free-spoken-digit-dataset”,“录音”);广告= audioDatastore (dataFolder); 为一个例子,演示如何处理这些数据深度学习,明白了语音数字识别与小波散射和深度学习。	音频分类、语音识别。
柏林的情感语音数据库	柏林的情感语音数据库包含535个口语话语10演员旨在传达的情绪:愤怒、无聊、厌恶、焦虑、恐惧、快乐、悲伤、或中性[31]。情感是文本无关的。文件名称代码指示演讲者ID、文本语言,情感,和版本。解释代码的网站包含一个关键和关于扬声器的附加信息,如年龄。下载柏林的情感语音数据库http://emodb.bilderbar.info/index - 1280. - html。数据集是大约40 MB。集`dataFolder`数据的位置。使用`audioDatastore`创建一个数据存储包含文件名和相应的标签。 dataFolder = tempdir;广告= audioDatastore (fullfile (dataFolder,“wav”)); 为一个例子,演示如何处理这些数据深度学习,明白了语音情感识别。	音频分类、语音识别。
图坦卡蒙声场景2017	图坦卡蒙声场景2017数据集由十秒从15个声场景包括音频片段公共汽车,车,图书馆。下载并提取图坦卡蒙声场景2017数据集图坦卡蒙声场景2017年,开发数据集和2017年图坦卡蒙声场景,评估数据集 [32]。为一个例子,演示如何处理这些数据深度学习,明白了声场景识别使用后期融合。	声场景分类

语音命令

语音命令数据集由大约65000个音频文件包括标有1的12类是的,没有,在,从,以及类对应于未知的命令和背景噪音[30]。

下载并提取语音命令数据集https://storage.googleapis.com/download.tensorflow.org/data/speech_commands_v0.01.tar.gz。数据集是关于1.4 GB。

集dataFolder数据的位置。使用audioDatastore创建一个数据存储包含文件名和相应的标签。

dataFolder = tempdir;广告= audioDatastore (dataFolder,…“IncludeSubfolders”,真的,…“FileExtensions”,“wav”,…“LabelSource”,“foldernames”);

为一个例子,演示如何处理这些数据深度学习,明白了使用深度学习训练语音命令识别模型。

音频分类、语音识别

Mozilla共同的声音

Mozilla常见语音数据集由录音讲话和对应的文本文件。数据还包括人口统计元数据,比如年龄和口音。

下载并提取Mozilla常见语音数据集的数据集https://voice.mozilla.org/。是一个开放的数据集的数据集,这意味着它能随着时间的推移而增长。截至2019年10月,数据集是关于28 GB。集dataFolder数据的位置。使用audioDatastore创建一个数据存储包含文件名和相应的标签。

dataFolder = tempdir;广告= audioDatastore (fullfile (dataFolder,“剪辑”));

音频分类、语音识别。

免费使用数字数据集

免费使用数字数据集,2000年1月29日,2019年,由获得的英语数字0到9的录音从四个扬声器。两个扬声器的这个版本是美国英语和母语的非本地的两个喇叭扬声器分别与比利时法国和德国口音的英语。数据采样在8000赫兹。

下载免费使用数字数据集(FSDD)录音https://github.com/Jakobovski/free-spoken-digit-dataset。

集dataFolder数据的位置。使用audioDatastore创建一个数据存储包含文件名和相应的标签。

dataFolder = fullfile (tempdir,“free-spoken-digit-dataset”,“录音”);广告= audioDatastore (dataFolder);

为一个例子,演示如何处理这些数据深度学习,明白了语音数字识别与小波散射和深度学习。

音频分类、语音识别。

柏林的情感语音数据库

柏林的情感语音数据库包含535个口语话语10演员旨在传达的情绪:愤怒、无聊、厌恶、焦虑、恐惧、快乐、悲伤、或中性[31]。情感是文本无关的。

文件名称代码指示演讲者ID、文本语言,情感,和版本。解释代码的网站包含一个关键和关于扬声器的附加信息,如年龄。

下载柏林的情感语音数据库http://emodb.bilderbar.info/index - 1280. - html。数据集是大约40 MB。

集dataFolder数据的位置。使用audioDatastore创建一个数据存储包含文件名和相应的标签。

dataFolder = tempdir;广告= audioDatastore (fullfile (dataFolder,“wav”));

为一个例子,演示如何处理这些数据深度学习,明白了语音情感识别。

音频分类、语音识别。

图坦卡蒙声场景2017

图坦卡蒙声场景2017数据集由十秒从15个声场景包括音频片段公共汽车,车,图书馆。

下载并提取图坦卡蒙声场景2017数据集图坦卡蒙声场景2017年,开发数据集和2017年图坦卡蒙声场景,评估数据集 [32]。

为一个例子,演示如何处理这些数据深度学习,明白了声场景识别使用后期融合。

声场景分类

点云数据集

数据描述任务

数据	描述	任务
WPI激光雷达数据	WPI激光雷达数据收集使用一个下台OS1传感器。它包含组织的激光雷达点云扫描高速公路场景和相应的地面实况为汽车和卡车对象标签。云存储为数据集有1617点`pointCloud`(计算机视觉工具箱)细胞中的对象数组。数据文件的大小大约是760 MB。执行这段代码下载数据集。 url =“//www.tatmou.com/金宝appsupportfiles/lidar/data/WPI_LidarData.tar.gz”;outputFolder = fullfile (tempdir,批发价格指数的);lidarDataTarFile = fullfile (outputFolder,“WPI_LidarData.tar.gz”);如果~存在(lidarDataTarFile“文件”mkdir (outputFolder);disp (“下载WPI激光雷达驾驶数据(760 MB)……”);websave (lidarDataTarFile、url);解压(lidarDataTarFile outputFolder);结束lidarData =负载(fullfile (outputFolder“WPI_LidarData.mat”)); 根据您的网络连接,下载过程可能需要一些时间。或者,您可以直接下载数据集到您的本地磁盘从web浏览器使用的URL,并提取`WPI_LidarData`文件夹中。如果你这样做,改变`outputFolder`变量在代码下载文件的位置。< p > 为一个例子,演示如何处理这些数据深度学习,明白了激光雷达点云的语义分割使用PointSeg深度学习网络。	语义分割
PandaSet数据	PandaSet包含2560个组织激光雷达点云扫描各种城市通过Pandar 64传感器捕获的场景。数据集提供了12个不同的语义分割标签类和3 d边界框信息三个类,汽车,卡车,和行人。数据集的大小是5.2 GB。执行这段代码下载数据集。 url =“https://ssd.mathworks.com/金宝appsupportfiles/lidar/data/Pandaset_LidarData.tar.gz”;outputFolder = fullfile (tempdir,“Pandaset”);lidarDataTarFile = fullfile (outputFolder,“Pandaset_LidarData.tar.gz”);如果~存在(lidarDataTarFile“文件”mkdir (outputFolder);disp (“下载Pandaset激光雷达驾驶数据(5.2 GB)……”);websave (lidarDataTarFile、url);解压(lidarDataTarFile outputFolder);结束lidarData = fullfile (outputFolder,激光雷达的);labelsFolder = fullfile (outputFolder,“semanticLabels”); 根据您的网络连接,下载过程可能需要一些时间。或者,您可以下载数据集到您的本地磁盘从web浏览器使用的URL,然后提取`Pandaset_LidarData`文件夹中。如果你这样做,改变`outputFolder`变量在代码下载文件的位置。示例显示了如何处理这些数据的深度学习,明白了激光雷达点云的语义分割使用SqueezeSegV2深度学习网络和激光雷达三维物体探测使用PointPillars深度学习。	对象检测、语义分割

WPI激光雷达数据

WPI激光雷达数据收集使用一个下台OS1传感器。它包含组织的激光雷达点云扫描高速公路场景和相应的地面实况为汽车和卡车对象标签。

云存储为数据集有1617点pointCloud(计算机视觉工具箱)细胞中的对象数组。数据文件的大小大约是760 MB。

执行这段代码下载数据集。

url =“//www.tatmou.com/金宝appsupportfiles/lidar/data/WPI_LidarData.tar.gz”;outputFolder = fullfile (tempdir,批发价格指数的);lidarDataTarFile = fullfile (outputFolder,“WPI_LidarData.tar.gz”);如果~存在(lidarDataTarFile“文件”mkdir (outputFolder);disp (“下载WPI激光雷达驾驶数据(760 MB)……”);websave (lidarDataTarFile、url);解压(lidarDataTarFile outputFolder);结束lidarData =负载(fullfile (outputFolder“WPI_LidarData.mat”));

根据您的网络连接,下载过程可能需要一些时间。或者,您可以直接下载数据集到您的本地磁盘从web浏览器使用的URL,并提取WPI_LidarData文件夹中。如果你这样做,改变outputFolder变量在代码下载文件的位置。< p >

为一个例子,演示如何处理这些数据深度学习,明白了激光雷达点云的语义分割使用PointSeg深度学习网络。

语义分割

PandaSet数据

PandaSet包含2560个组织激光雷达点云扫描各种城市通过Pandar 64传感器捕获的场景。数据集提供了12个不同的语义分割标签类和3 d边界框信息三个类,汽车,卡车,和行人。数据集的大小是5.2 GB。

执行这段代码下载数据集。

url =“https://ssd.mathworks.com/金宝appsupportfiles/lidar/data/Pandaset_LidarData.tar.gz”;outputFolder = fullfile (tempdir,“Pandaset”);lidarDataTarFile = fullfile (outputFolder,“Pandaset_LidarData.tar.gz”);如果~存在(lidarDataTarFile“文件”mkdir (outputFolder);disp (“下载Pandaset激光雷达驾驶数据(5.2 GB)……”);websave (lidarDataTarFile、url);解压(lidarDataTarFile outputFolder);结束lidarData = fullfile (outputFolder,激光雷达的);labelsFolder = fullfile (outputFolder,“semanticLabels”);

根据您的网络连接,下载过程可能需要一些时间。或者,您可以下载数据集到您的本地磁盘从web浏览器使用的URL,然后提取Pandaset_LidarData文件夹中。如果你这样做,改变outputFolder变量在代码下载文件的位置。

示例显示了如何处理这些数据的深度学习,明白了激光雷达点云的语义分割使用SqueezeSegV2深度学习网络和激光雷达三维物体探测使用PointPillars深度学习。

对象检测、语义分割

引用

[1]湖,Brenden M。,Ruslan Salakhutdinov, and Joshua B. Tenenbaum. “Human-Level Concept Learning through Probabilistic Program Induction.”科学350年,没有。6266(2015年12月11日):1332 - 38。https://doi.org/10.1126/science.aab3050。

[2]TensorFlow团队。“花”https://www.tensorflow.org/datasets/catalog/tf_flowers。

[3]Kat,郁金香、图像、https://www.flickr.com/photos/swimparallel/3455026124。Creative Commons许可(CC)。

Rob Bertholf [4]向日葵、图像、https://www.flickr.com/photos/robbertholf/20777358950。Creative Commons 2.0通用许可证。

[5]帕文,玫瑰、图像、https://www.flickr.com/photos/55948751@N00。Creative Commons 2.0通用许可证。

[6]约翰·海斯蓝蒲公英、图像、https://www.flickr.com/photos/foxypar4/645330051。Creative Commons 2.0通用许可证。

[7]Krizhevsky,亚历克斯。“学习的多层功能从微小的图像。”MSc thesis, University of Toronto, 2009.- 2009 tr.pdf https://www.cs.toronto.edu/%7ekriz/learning特性。

加布里埃尔·[8]Brostow J。,Julien Fauqueur, and Roberto Cipolla. “Semantic Object Classes in Video: A High-Definition Ground Truth Database.”模式识别的字母30日,没有。2(2009年1月):88 - 97。https://doi.org/10.1016/j.patrec.2008.04.005。

[9]Kemker、罗纳德·卡尔Salvaggio,克里斯托弗Kanan。“高分辨率多光谱数据集语义分割。”ArXiv: 1703.01918 (Cs),2017年3月6日。https://arxiv.org/abs/1703.01918。

[10]Isensee,费边,菲利普Kickingereder,沃尔夫冈•维克马丁Bendszus,克劳斯·h·Maier-Hein。“大脑肿瘤分割和Radiomics生存预测:2017年贡献的后代的挑战。“在Brainlesion:神经胶质瘤、多发性硬化、中风和创伤性脑损伤、编辑亚历桑德罗·Crimi Spyridon巴卡,Hugo Kuijf Bjoern Menze, Mauricio雷耶斯,10670:287 - 97。瑞士Cham:施普林格国际出版,2018年。https://doi.org/10.1007/978 - 3 - 319 - 75238 - 9 _25。

[11]Ehteshami Bejnordi、Babak Mitko高山病,保罗•约翰内斯·范·迪斯特布拉姆·范·Ginneken尼科Karssemeijer, Geert Litjens,珀斯a·w·m·范德Laak et al。”诊断评估深度学习算法的检测在乳腺癌患者淋巴结转移。”《美国医学会杂志》318年,没有。22日(2017年12月12日):2199。https://doi.org/10.1001/jama.2017.14585。

[12]·麦克洛,h陈,B。,Holmes, D., III, Duan, X., Yu, Z., Yu, L., Leng, S., Fletcher, J. (2020). Data from Low Dose CT Image and Projection Data [Data set]. The Cancer Imaging Archive. https://doi.org/10.7937/9npb-2637.

[13]授予EB017095和EB017185(辛西娅·麦克洛π),从国家生物医学成像和生物工程研究所。

[14]Grubinger迈克尔·保罗·克劳夫Henning穆勒,托马斯Deselaers。“IAPR TC-12基准:一个新的视觉信息系统的评价资源。”诉讼OntoImage 2006语言资源的基于内容的图像检索。意大利热那亚。5卷,2006年5月,p。10。

[15]Ignatov,安德烈,吕克·范·干傻事,拉杜Timofte。“替换移动相机ISP与单个深度学习模式。”ArXiv: 2002.05509 (Cs,套),2020年2月13日。https://arxiv.org/abs/2002.05509。项目网站。

[16]陈,陈,陈奇峰,贾许,Vladlen Koltun。“学习在黑暗中看到。”ArXiv: 1805.01934 (Cs),2018年5月4日。https://arxiv.org/abs/1805.01934。

[17]生活:实验室工程图片和视频。https://live.ece.utexas.edu/research/ChallengeDB/index.html。

[18]Ozgenel C。F。,和Arzu Gönenç Sorguç. “Performance Comparison of Pretrained Convolutional Neural Networks on Crack Detection in Buildings.” Taipei, Taiwan, 2018.https://doi.org/10.22260/ISARC2018/0094。

[19],Lei,风扇,张勇义民庙和朱应朱莉。“道路裂缝检测使用卷积神经网络。“在2016 IEEE International Conference on Image Processing (ICIP), 3708–12. Phoenix, AZ, USA: IEEE, 2016.https://doi.org/10.1109/ICIP.2016.7533052。

吴[20],学识渊博,Jyh-Shing r .张成泽,Jui-Long陈。“晶圆图故障模式识别和相似性排名对大规模数据集。“IEEE半导体制造业28个,不。1(2015年2月):1 - 12。https://doi.org/10.1109/TSM.2014.2364237。

[21]张成泽,罗杰。“米尔全集。”http://mirlab.org/dataset/public/。

[22]Al-Dhabyani、瓦利德。穆罕默德戈马,该镇实行哈立德,法米阿里。“乳腺超声图像的数据集。”简单的数据(2020年2月28日):104863。https://doi.org/10.1016/j.dib.2019.104863。

[23]弗雷泽,j . A。,S. M. Hodge, J. L. Breeze, A. J. Giuliano, J. E. Terry, C. M. Moore, D. N. Kennedy, et al. “Diagnostic and Sex Effects on Limbic Volumes in Early-Onset Bipolar Disorder and Schizophrenia.”精神分裂症的公告34岁的没有。1(2007年10月27日):37-46。https://doi.org/10.1093/schbul/sbm120。

[24]奖赏,Mineichi,小君富山,学者Shimbo。“多维曲线分类使用通过地区。”模式识别的字母20日,没有。11 - 13日(1999年11月):1103 - 11所示。https://doi.org/10.1016/s0167 - 8655 (99) 00077 - x。

[25]奖赏,Mineichi,小君富山,学者Shimbo。日本元音数据集。通过UCI机器学习库分布。https://archive.ics.uci.edu/ml/datasets/Japanese +元音

[26]Saxena,阿凯Goebel唐西门,和尼尔·埃克伦。“损害传播为航空发动机建模run-to-failure模拟。”在预测和健康管理,2008年。2008年榜单。国际会议上,1 - 9页。IEEE 2008。

[27]Rieth,科里。,Ben D. Amsel, Randy Tran, and Maia B. Cook. "Additional Tennessee Eastman Process Simulation Data for Anomaly Detection Evaluation."哈佛Dataverse,2017年第1版。https://doi.org/10.7910/DVN/6C3JR1。

[28]不氩L。,Luis A. N. Amaral, Leon Glass, Jeffrey M. Hausdorff, Plamen Ch. Ivanov, Roger G. Mark, Joseph E. Mietus, George B. Moody, Chung-Kang Peng, and H. Eugene Stanley. "PhysioBank, PhysioToolkit, and PhysioNet: Components of a New Research Resource for Complex Physiologic Signals."循环101年,23号,2000,pp. e215-e220。https://circ.ahajournals.org/content/101/23/e215.full。

[29]拉古纳,巴勃罗,罗杰·g·马克,必要l . Goldberger和乔治·b·穆迪。“数据库评估算法测量心电图QT间隔和其他波形的。”计算机在心脏病学24日,1997年,页673 - 676。

[30]监狱长,皮特。“语音命令:一个公共数据集单字原图语音识别”,2017。可以从http://download.tensorflow.org/data/speech_commands_v0.01.tar.gz。版权2017年谷歌。语音命令数据集是创作共用署名4.0许可下的,可用:https://creativecommons.org/licenses/by/4.0/legalcode。

[31]Burkhardt,费利克斯,阿斯特丽德Paeschke,梅丽莎·a .创建人沃尔特·f·Sendlmeier Weiss和便雅悯。“德国情感语音数据库。”Interspeech学报》2005。葡萄牙里斯本:国际言语交际协会,2005。

[32]Mesaros Annamaria,托尼Heittola,和图维尔塔宁。“声场景分类:概述DCASE 2017条目的挑战。”在2018年16日国际研讨会声学信号增强(IWAENC),411 - 415页。IEEE 2018。

[33]Hesai和规模。PandaSet。https://scale.com/open-datasets/pandaset

另请参阅

trainingOptions|trainNetwork

深度学习的数据集

图像数据集

时间序列和信号数据集

视频数据集

文本数据集

音频数据集

点云数据集

引用

另请参阅

相关的话题