このペ,ジの翻訳は最新ではありません。ここをクリックして,英語の最新版を参照してください。
これらのデ,タセットを使用して,深層学習の応用を開始します。
デ,タセット | 説明 | タスク |
---|---|---|
数字 |
数字デタセットは,10000個の手書き数字の合成グレスケルメジで構成されています。各イメージは28 x 28ピクセルで,イメージが表す数字(0 ~ 9)を示すラベルが関連付けられています。各▪▪メ▪▪ジには特定な角度の回転が付けられています。。 関数 [XTrain,YTrain,anglesTrain] = digitTrain4DArrayData;[XTest,YTest,anglesTest] = digitTest4DArrayData; このデタを深層学習用に処理する方法を示す例にいては,深層学習における学習の進行状況の監視および回帰用の畳み込みニュ,ラルネットワ,クの学習を参照してください。 |
@ @ @ @ @ @ @ @ @ @ @ @ @ @ @ @ @ @ |
関数 dataFolder = fullfile(toolboxdir(“nnet”),“nndemos”,“nndatasets”,“DigitDataset”);imds = imageDatastore(数据文件夹,...“IncludeSubfolders”,真的,....“LabelSource”,“foldernames”); このデタを深層学習用に処理する方法を示す例にいては,分類用のシンプルな深層学習ネットワ,クの作成を参照してください。 |
メ,ジ分類 | |
MNIST (典型例) |
70000年MNISTデータセットは個の手書き数字で構成されていて,60000個のイメージをもつ学習用区画と10000個のイメージをもつテスト用区画に分かれています。各イメージは28 x 28ピクセルで,イメージが表す数字(0 ~ 9)を示すラベルが関連付けられています。 Mnistファ苹果苹果ルをhttp://yann.lecun.com/exdb/mnist/からダウンロ,ドし,デ,タセットをワ,クスペ,スに読み込みます。ファereplicationルからMATLAB配列としてデータを読み込むには、ファイルを解凍して作業ディレクトリに保存し、変分自己符号化器(vae)の学習によるメジ生成の例で使用されている補助関数 Oldpath = addpath(fullfile(matlabroot,“例子”,“nnet”,“主要”));filenameImagesTrain =“train-images.idx3-ubyte”;filenameLabelsTrain =“train-labels.idx1-ubyte”;filenameImagesTest =“t10k-images.idx3-ubyte”;filenameLabelsTest =“t10k-labels.idx1-ubyte”;XTrain = processImagesMNIST(filenameImagesTrain);YTrain = processLabelsMNIST(filenameLabelsTrain);XTest = processImagesMNIST(filenameImagesTest);YTest = processLabelsMNIST(filenameLabelsTest); このデタを深層学習用に処理する方法を示す例にいては,変分自己符号化器(vae)の学習によるメジ生成を参照してください。 パスを元に戻すには,関数 路径(媒介); |
メ,ジ分類 |
Omniglot |
Omniglotデータセットには50個のアルファベットの文字セットが含まれていて,そのうち30セットが学習用に,20セットがテスト用に分けられています。それぞれのアルファベットには,Ojibwe(カナダ先住民文字)の14個の文字から曾の55個の文字まで,数多くの文字が含まれています。そして,それぞれの文字には20個の手書きの観測値があります。 https://github.com/brendenlake/omniglotからOmniglotデ,タセット[1]をダウンロ,ドして解凍します。 downloadFolder = tempdir;url =“https://github.com/brendenlake/omniglot/raw/master/python”;urlTrain = url +“/ images_background.zip”;urlTest = url +“/ images_evaluation.zip”;fileametrain = fullfile(下载文件夹,“images_background.zip”);filenameTest = fullfile(下载文件夹,“images_evaluation.zip”);dataFolderTrain = fullfile(下载文件夹,“images_background”);dataFolderTest = fullfile(下载文件夹,“images_evaluation”);如果~存在(dataFolderTrain“dir”)流(“下载Omniglot训练数据集(4.5 MB)…”) websave (filenameTrain urlTrain);解压缩(filenameTrain downloadFolder);流(“完成。\ n”)结束如果~存在(dataFolderTest“dir”)流(“下载Omniglot测试数据(3.2 MB)…”) websave (filenameTest urlTest);解压缩(filenameTest downloadFolder);流(“完成。\ n”)结束 学習デタとテストデタをメジデタストアとして読み込むには,関数 imdsTrain = imageDatastore(dataFolderTrain,...“IncludeSubfolders”,真的,...“LabelSource”,“没有”);files = imdsTrain.Files;Parts = split(files,filesep);标签= join(parts(:,(end-2):(end-1)),“_”);imdsTrain。标签= categorical(labels); imdsTest = imageDatastore(dataFolderTest,...“IncludeSubfolders”,真的,...“LabelSource”,“没有”);files = imdsTest.Files;Parts = split(files,filesep);标签= join(parts(:,(end-2):(end-1)),“_”);imdsTest。标签= categorical(labels); このデタを深層学習用に処理する方法を示す例にいては,シャムネットワクの学習とメジの比較を参照してください。 |
メ,ジ類似度 |
花 |
花のデタセットには,5のクラス(“デジ”,“タンポポ”,“バラ”,“ヒマワリ”,および"チュリップ")に属する3670個の花のメジが含まれています。 http://download.tensorflow.org/example_images/flower_photos.tgzから花のデ,タセット[2]をダウンロ,ドして解凍します。このデ,タセットは約218 MBです。。 url =“http://download.tensorflow.org/example_images/flower_photos.tgz”;downloadFolder = tempdir;文件名= fullfile(下载文件夹,“flower_dataset.tgz”);dataFolder = fullfile(下载文件夹,“flower_photos”);如果~存在(dataFolder“dir”)流("正在下载Flowers数据集(218 MB)…") websave(文件名,url);解压(文件名,downloadFolder)流(“完成。\ n”)结束 関数 imds = imageDatastore(数据文件夹,...“IncludeSubfolders”,真的,...“LabelSource”,“foldernames”); このデタを深層学習用に処理する方法を示す例にいては,敵対的生成ネットワ,ク(gan)の学習を参照してください。 |
メ,ジ分類 |
食品▪▪メ▪▪ジのサンプル |
食品▪▪メ▪▪ジのサンプルデ▪タセットには,9▪▪のクラス(“シ,ザ,サラダ”,“カプレ,ゼサラダ”,“フラ电子邮箱ドポテト”,“グリ,クサラダ”,“ハンバ,ガ,”,“ホットドッグ”,“ピザ”,“刺身”,および“寿司”)に属する978枚の写真が含まれています。 //www.tatmou.com/金宝appsupportfiles/nnet/data/ExampleFoodImageDataset.zipから食品メジのサンプルデタセットをダウンロドして解凍します。このデタセットは約77 MBです。。 url =“//www.tatmou.com/金宝appsupportfiles/nnet/data/ExampleFoodImageDataset.zip”;downloadFolder = tempdir;文件名= fullfile(下载文件夹,“ExampleFoodImageDataset.zip”);dataFolder = fullfile(下载文件夹,“ExampleFoodImageDataset”);如果~存在(dataFolder“dir”)流(“下载示例食品图像数据集(77 MB)…”) websave(文件名,url);解压缩(文件名,downloadFolder);流(“完成。\ n”)结束 このデタを深層学習用に処理する方法を示す例にいては,Tsneを使用したネットワ,クの動作の表示を参照してください。 |
メ,ジ分類 |
CIFAR-10 (典型例) |
Cifar-10デ,タセットには,10個のクラス("飛行機"、"自動車"、"鳥"、"猫"、"鹿"、"犬"、"蛙"、"馬"、“船”,および“トラック”)に属する32 x 32ピクセルのカラーイメージが60000個含まれています。 1。このデータセットは,50000個のイメージから成る学習セットと10000個のイメージから成るテストセットに分かれています。このデータセットは,新しいイメージ分類モデルのテストに最も広く使用されているデータセットのひとつです。 https://www.cs.toronto.edu/%7Ekriz/cifar-10-matlab.tar.gzからcifar-10デ,タセット[7]をダウンロ,ドして解凍します。このデ,タセットは約175 MBです。。 url =“https://www.cs.toronto.edu/ ~ kriz / cifar-10-matlab.tar.gz”;downloadFolder = tempdir;文件名= fullfile(下载文件夹,“cifar-10-matlab.tar.gz”);dataFolder = fullfile(下载文件夹,“cifar-10-batches-mat”);如果~存在(dataFolder“dir”)流("下载CIFAR-10数据集(175mb)…");websave(文件名、url);解压(文件名,downloadFolder);流(“完成。\ n”)结束 loadCIFARData を使用して,このデ,タを数値配列に変換します。Oldpath = addpath(fullfile(matlabroot,“例子”,“nnet”,“主要”));[XTrain,YTrain,XValidation,YValidation] = loadCIFARData(downloadFolder); このデタを深層学習用に処理する方法を示す例にいては,イメージ分類用の残差ネットワークの学習を参照してください。 パスを元に戻すには,関数 路径(媒介); |
メ,ジ分類 |
MathWorks®营销上 |
75年これは個のMathWorksの商品イメージから成る小さなデータセットであり,5つの異なるクラス(“帽”,“立方体”,“打牌”,“螺丝刀”,および“火炬”)に属します。このデタセットを使用して転移学習やメジ分類を素早く試すことができます。 イメージのサイズは227 x 227 x 3です。 MathWorks Merchデ,タセットを解凍します。 文件名=“MerchData.zip”;dataFolder = fullfile(tempdir,“MerchData”);如果~存在(dataFolder“dir”解压缩(文件名,tempdir);结束 関数 imds = imageDatastore(数据文件夹,...“IncludeSubfolders”,真的,....“LabelSource”,“foldernames”); このデタを深層学習用に処理する方法を示す例にいては,転移学習入門および新しいメジを分類するための深層学習ネットワクの学習を参照してください。 |
メ,ジ分類 |
CamVid |
CamVidデータセットは,運転中の車両から得られた路上レベルのビューが含まれるイメージコレクションです。デタセットは,メジのセマンティックセグメンテションを行うネットワクの学習に役立ます。また,"車"、"歩行者"、“道路”を含む32個のセマンティッククラスにいてピクセルレベルのラベルを提供します。 イメージのサイズは720 x 960 x 3です。 http://web4.cs.ucl.ac.uk/staff/g.brostow/MotionSegRecDataからCamVidデ,タセット[8]をダウンロ,ドして解凍します。このデ,タセットは約573 MBです。。 downloadFolder = tempdir;url =“http://web4.cs.ucl.ac.uk/staff/g.brostow/MotionSegRecData”urlImages = url +“/文件/ 701 _stillsraw_full.zip”;urlLabels = url +“/数据/ LabeledApproved_full.zip”;dataFolder = fullfile(下载文件夹,“CamVid”);dataFolderImages = fullfile(数据文件夹,“图片”);dataFolderLabels = fullfile(数据文件夹,“标签”);filenameLabels = fullfile(数据文件夹,“labels.zip”);fileameimages = fullfile(数据文件夹,“images.zip”);如果~存在(filenameLabels“文件”) || ~exist(imagesZip,“文件”mkdir(dataFolder)“下载CamVid数据集图像(557 MB)…”);websave (filenameImages urlImages);解压缩(filenameImages dataFolderImages);流(“完成。\ n”)流(“下载CamVid数据集标签(16mb)…”);websave (filenameLabels urlLabels);解压缩(filenameLabels dataFolderLabels);流(“完成。\ n”)结束 関数 Oldpath = addpath(fullfile(matlabroot,“例子”,“deeplearning_shared”,“主要”));imds = imageDatastore(dataFolderImages,“IncludeSubfolders”,真正的);类= [“天空”“建筑”“极”“路”“路面”“树”...“SignSymbol”“篱笆”“汽车”“行人”“自行车”];labelIDs = camvidPixelLabelIDs;pxds = pixelLabelDatastore(dataFolderLabels,classes,labelIDs); このデタを深層学習用に処理する方法を示す例にいては,深層学習を使用したセマンティックセグメンテ,ションを参照してください。 パスを元に戻すには,関数 路径(媒介); |
セマンティックセグメンテ,ション |
車両 |
車両データセットは,1個または2個のラベル付けされた車両インスタンスを含む295個のイメージで構成されています。この小さなデータセットはYOLO-v2の学習手順を調べるうえで役立ちますが,実際にロバストな検出器に学習させるにはラベル付けされたイメージがより多く必要になります。 イメージのサイズは720 x 960 x 3です。 車両デ,タセットを解凍します。 文件名=“vehicleDatasetImages.zip”;dataFolder = fullfile(tempdir,“vehicleImages”);如果~存在(dataFolder“dir”解压缩(文件名,tempdir);结束 解凍した垫ファイルから,ファイル名と境界ボックスの表としてデータセットを読み込み,ファイル名を絶対ファイルパスに変換します。 数据=负载(“vehicleDatasetGroundTruth.mat”);vehicleDataset = data.vehicleDataset;vehicleDataset。imageFilename = fullfile(tempdir,vehicleDataset.imageFilename);
関数 filenamesImages = vehicleDataset.imageFilename;tblBoxes = vehicleDataset(:,“汽车”);imds = imageDatastore(filenamesImages);blds = boxLabelDatastore(tblBoxes);CDS = combine(imds,blds);
このデタを深層学習用に処理する方法を示す例にいては,YOLO v2深層学習を使用したオブジェクトの検出を参照してください。 |
オブジェクトの検出 |
RIT-18 |
RIT-18データセットには,ニューヨーク州にあるハムリンビーチ州立公園の上空をドローンで撮影したイメージデータが含まれています。このデ,タには,18個のオブジェクトクラスラベル("路面標示"、"樹木"、“ビル”など)の付いた,ラベル付き学習セット,検証セットおよびテストセットが含まれます。 https://www.cis.rit.edu/%7Ermk6217/rit18_data.matからrit-18デ,タセット[9]をダウンロ,ドします。このデタセットは約3gbです。。 downloadFolder = tempdir;url =“http://www.cis.rit.edu/ ~ rmk6217 / rit18_data.mat”;文件名= fullfile(下载文件夹,“rit18_data.mat”);如果~存在(文件名,“文件”)流(“正在下载哈姆林海滩数据集(3gb)…”);websave(文件名、url);流(“完成。\ n”)结束 このデタを深層学習用に処理する方法を示す例にいては,深層学習を使用したマルチスペクトルメジのセマンティックセグメンテションを参照してください。 |
セマンティックセグメンテ,ション |
有钱的孩子 |
小鬼データセットには,脳腫瘍,すなわち最も一般的な原発性悪性脳腫瘍である神経膠腫のMRIスキャンが格納されています。 750年データセットには個の4次元ボリュームが格納されており,それぞれが3次元イメージのスタックを表します。各4次元ボリュームのサイズは240 x 240 x 155 x 4であり,最初の3つの次元は3次元ボリュームイメージの高さ,幅,奥行に対応します。4番目の次元は異なるスキャンモダリティに対応します。このデータセットは,ボクセルラベルを含む484個の学習ボリュームと266個のテストボリュームに分割されています。 BraTSデ,タセット[10]を格納するディレクトリを作成します。 dataFolder = fullfile(tempdir,“小鬼”);如果~存在(dataFolder“dir”mkdir (dataFolder);结束 医疗细分十项全能(下载数据)でリンクをクリックして小鬼データをダウンロードします。“Task01_BrainTumour.tar”ファイルをダウンロードします。このデ,タセットは約7gbです。。 変数 このデタを深層学習用に処理する方法を示す例にいては,深層学習を使用した脳腫瘍の3次元セグメンテションを参照してください。 |
セマンティックセグメンテ,ション |
Camelyon16 |
Camelyon16チャレンジのデータには,2つの独立したソースによるリンパ節のWSIが合計400個含まれており,270個の学習イメージと130個のテストイメージに分かれています。WSIは11レベルのピラミッド構造をもつストリップ形式气管无名动脉瘘管的のファイルとして格納されています。 学習データセットは,正常なリンパ節の159個のスライドガラス標本全体のイメージ(WSI)と腫瘍組織と正常組織を含むリンパ節の111個のWSIで構成されています。通常,腫瘍組織の割合は正常組織に比べるとごくわずかです。腫瘍メジには病変境界のグラウンドトゥルス座標が付属しています。 Camelyon16デ,タセット[11]を格納するディレクトリを作成します。 dataFolderTrain = fullfile(tempdir,“Camelyon16”,“培训”);dataFolderNormalTrain = fullfile(dataFolderTrain,“正常”);dataFolderTumorTrain = fullfile(dataFolderTrain,“肿瘤”);dataFolderAnnotationsTrain = fullfile(dataFolderTrain,“lesion_annotations”);如果~存在(dataFolderTrain“dir”mkdir (dataFolderTrain);mkdir (dataFolderNormalTrain);mkdir (dataFolderTumorTrain);mkdir (dataFolderAnnotationsTrain);结束 Camelyon17で最初の[CAMELYON16数据集]リンクをクリックし,CAMELYON16データセットをダウンロードします。“培训”ディレクトリを開き,以下の手順に従います。
このデ,タセットは約2gbです。。 このデタを深層学習用に処理する方法を示す例にいては,blockedImageおよび深層学習を使用した,大きな多重解像度を参照してください。 |
▪▪▪▪▪▪ |
上下文中的公共对象(COCO) (典型例) |
Coco 2014学習メジデタセットは,82,783個のメジで構成されています。注釈デタには,各メジごとに最低5の対応するキャプションが格納されています。 Cocoデタセットを格納するディレクトリを作成します。 dataFolder = fullfile(tempdir,“可可”);如果~存在(dataFolder“dir”mkdir (dataFolder);结束 https://cocodataset.org/#downloadで[2014火车图片]と[2014火车/ Val注解]のリンクをクリックし,可可2014の学習イメージとキャプションをそれぞれダウンロードして解凍します。 関数 文件名= fullfile(数据文件夹,“annotations_trainval2014”,“注释”,...“captions_train2014.json”);STR = fileread(文件名);数据= jsondecode(str); 構造体の このデタを深層学習用に処理する方法を示す例にいては,アテンションを使用した▪▪メ▪▪ジキャプションの生成を参照してください。 |
メ,ジキャプションの生成 |
IAPR TC-12 (典型例) |
Iapr tc-12ベンチマ,クは,20000個の静止した自然,,,。このデ,タセットには,人物,動物,都市などの写真が含まれます。デタファルのサズは約1.8 gbです。 Iapr tc-12デ,タセットをダウンロ,ドします。 dataDir = fullfile(tempdir,“iaprtc12”);url =“http://www-i6.informatik.rwth-aachen.de/imageclef/resources/iaprtc12.tgz”;如果~存在(dataDir“dir”)流(“下载IAPR TC-12数据集(1.8 GB)…\n”);试一试解压(url, dataDir);抓在某些Windows机器上,untar命令会出错。tgz%的文件。重命名为.tg,然后重试。文件名= fullfile(tempdir,“iaprtc12.tg”);websave(文件名、url);解压(文件名,dataDir);结束流(“做。\ n \ n”);结束 関数 imagadir = fullfile(dataDir,“图片”) exts = {“jpg”,bmp格式的,“使用”};imds = imageDatastore(imageDir,...“IncludeSubfolders”,真的,...“FileExtensions”ext); このデタを深層学習用に処理する方法を示す例にいては,深層学習を使用した単一▪▪メ▪▪ジ超解像処理を参照してください。 |
图片对图片回帰 |
苏黎世RAW转RGB |
苏黎世原始RGBデータセットには,サイズが448 x 448の,空間的にレジストレーションされた生学習イメージパッチおよびRGB学習イメージパッチが48043ペア登録されています。このデタセットには2の異なるテストセットが格納されています。一方のテストセットは,サイズが448 x 448の,空間的にレジストレーションされた原始イメージパッチおよびRGBイメージパッチ1204ペアで構成されています。もう一方のテストセットはレジストレーションされていない高解像度生イメージおよびRGBイメージで構成されています。このデタセットのサズは22 gbです。 デ,タセットを格納するディレクトリを作成します。 imageDir = fullfile(tempdir,“ZurichRAWToRGB”);如果~存在(imageDir“dir”mkdir (imageDir);结束 imageDir で指定されたディレクトリにデ,タを解凍します。解凍に成功すると,imageDir にはfull_resolution 、测验 ,および火车 という名前の3のディレクトリが格納されています。< p >このデタを深層学習用に処理する方法を示す例にいては,深層学習を使用したカメラの生デタ処理パプランの構築を参照してください。 |
图片对图片回帰 |
デタ | 説明 | タスク |
---|---|---|
日本的元音 |
日语元音デ,タセット[12][13]には,さまざまな話者による日本語母音の発話を表す前処理済みのシ,ケンスが含まれています。
関数 [XTrain,YTrain] =日本evowelstraindata;[XTest,YTest] =日本evowelstestdata; このデタを深層学習用に処理する方法を示す例にいては,深層学習を使用したシ,ケンスの分類を参照してください。 |
从序列到标签分類 |
水ぼうそう |
水ぼうそうデータセットには,月に対応するタイムステップと発生件数に対応する値を含む1つの時系列が含まれています。出力はcell配列で,その各要素は1のタムステップです。 関数 数据= chickenpox_dataset;数据= [Data {:}]; このデタを深層学習用に処理する方法を示す例にいては,深層学習を使用した時系列予測を参照してください。 |
時系列予測 |
人の行動 |
行動データセットには,体に装着したスマートフォンから得られたセンサーデータの7つの時系列が含まれています。各シケンスには3の特徴があり,。3 .。 人の行動のデ,タセットを読み込みます。 dataTrain = load(“HumanActivityTrain”);dataTest = load(“HumanActivityTest”);XTrain = dataTrain.XTrain;YTrain = dataTrain.YTrain;XTest = dataTest.XTest;YTest = dataTest.YTest; このデタを深層学習用に処理する方法を示す例にいては,深層学習を使用した序列对序列分類を参照してください。 |
序列对序列分類 |
涡扇发动机退化仿真 |
涡扇发动机退化仿真デ,タセット[14]の各時系列は,それぞれ異なるエンジンを表します。開始時点では,各エンジンの初期摩耗の程度や製造上の差異は不明です。各時系列の開始時,エンジンは正常に運転していますが,時系列のある時点で故障が発生します。学習セットでは,システム障害が発生するまで,故障の規模が大きくなります。 このデータには,スペースで区切られた26列の数値のあるzip圧縮されたテキストファイルが含まれています。各行は1回の運転サクルの間に取得されたデタのスナップショットで,各列は異なる変数です。各列は以下に対応します。
涡扇发动机退化模拟データセットを格納するディレクトリを作成します。 dataFolder = fullfile(tempdir,“涡扇”);如果~存在(dataFolder“dir”mkdir (dataFolder);结束 涡扇发动机退化仿真数据集をhttps://ti.arc.nasa.gov/tech/dash/groups/pcoe/prognostic-data-repository/からダウンロ,ドして解凍します。 ファereplicationル 文件名=“CMAPSSData.zip”;解压缩(文件名,dataFolder)
補助関数 Oldpath = addpath(fullfile(matlabroot,“例子”,“nnet”,“主要”));fileamepredictors = fullfile(数据文件夹,“train_FD001.txt”);[XTrain,YTrain] = processTurboFanDataTrain(filenamePredictors);fileamepredictors = fullfile(数据文件夹,“test_FD001.txt”);fileameresponses = fullfile(数据文件夹,“RUL_FD001.txt”);[XTest,YTest] = processTurboFanDataTest(filenamePredictors, filenamerresponses); このデタを深層学習用に処理する方法を示す例にいては,深層学習を使用した序列对序列回帰を参照してください。 パスを元に戻すには,関数 路径(媒介); |
序列对序列回帰,予知保全 |
PhysioNet 2017挑战赛 |
PhysioNet 2017挑战赛デ,タセット[16]は,300 Hzでサンプリングされ,専門家グループによって次の4つの別々のクラスに分けられた,一連の心電図(ECG)記録で構成されています。正常(N), AFib (A),その他の律動(O),およびノ` `ズを含む録音(~)。 長短期記憶ネットワクを使用したecg信号の分類の例で使用されている このデタセットは約95 MBです。。 Oldpath = addpath(fullfile(matlabroot,“例子”,“deeplearning_shared”,“主要”));ReadPhysionetData data = load(“PhysionetData.mat”)信号=数据。信号;labels = data.Labels; このデタを深層学習用に処理する方法を示す例にいては,長短期記憶ネットワクを使用したecg信号の分類を参照してください。 パスを元に戻すには,関数 路径(媒介); |
从序列到标签分類 |
田纳西伊士曼过程(TEP)シミュレ,ション |
このデータセットは,田纳西伊士曼过程(TEP)のシミュレーションデータから変換された垫ファイルで構成されています。 MathWorksのサポートファイルサイトから,田纳西伊士曼过程(TEP)シミュレーションデータセット[15]をダウンロドします(免責事項を参照してください)。このデ,タセットには,次の4 .。故障なしの学習,故障なしのテスト,故障ありの学習,故障ありのテスト各ファ▪▪ルを別々にダウンロ▪▪ドします。 このデタセットは約1.7 gbです。。 url金宝appSupportFiles =“//www.tatmou.com/金宝appsupportfiles/predmaint”;url = url金宝appSupportFiles +“/ chemical-process-fault-detection-data / faultytesting.mat”;流(“正在下载TEP故障测试数据(1gb)…”) websave (“faultytesting.mat”url);流(“完成。\ n”) url = url金宝appSupportFiles +“/ chemical-process-fault-detection-data / faultytraining.mat”;流(“正在下载TEP故障训练数据(613 MB)…”) websave (“faultytraining.mat”url);流(“完成。\ n”) url = url金宝appSupportFiles +“/ chemical-process-fault-detection-data / faultfreetesting.mat”;流(“下载TEP无故障测试数据(69 MB)…”) websave (“faultfreetesting.mat”url);流(“完成。\ n”) url = url金宝appSupportFiles +“/ chemical-process-fault-detection-data / faultfreetraining.mat”;流(“下载TEP无故障训练数据(36 MB)…”) websave (“faultfreetraining.mat”url);流(“完成。\ n”) ダウンロドしたファルをmatlab®ワ,クスペ,スに読み込みます。 负载(“faultfreetesting.mat”);负载(“faultfreetraining.mat”);负载(“faultytesting.mat”);负载(“faultytraining.mat”); このデタを深層学習用に処理する方法を示す例にいては,深層学習を使用した化学的プロセスの故障検出を参照してください。 |
从序列到标签分類 |
PhysioNet心电图分割 |
PhysioNet ECGセグメンテ,ションデ,タセット[16][17]は,合計105人の患者からの約15分間のecgの記録で構成されています。各記録を取得するために,検査員は患者の胸部の異なる場所に2つの電極を配置して,2チャネル信号にします。このデータベースは,自動化されたエキスパートシステムによって生成される信号領域ラベルを提供します。 https://github.com/mathworks/physionet_ECG_segmentationから downloadFolder = tempdir;url =“https://github.com/mathworks/physionet_ECG_segmentation/raw/master/QT_Database-master.zip”;文件名= fullfile(下载文件夹,“QT_Database-master.zip”);dataFolder = fullfile(下载文件夹,“QT_Database-master”);如果~存在(dataFolder“dir”)流(下载Physionet心电分割数据集(72 MB)…) websave(文件名,url);解压缩(文件名,downloadFolder);流(“完成。\ n”)结束 解凍すると,一時ディレクトリにフォルダ
负载(fullfile (dataFolder“QTData.mat”))
このデタを深層学習用に処理する方法を示す例にいては,深層学習を使用した波形セグメンテ,ションを参照してください。 |
序列到标签分類,波形セグメンテ,ション |
歩行者,自動車,自転車運転者の合成後方散乱 |
深層学習を使用した歩行者と自転車運転者の分類の例で使用されている補助関数 補助関数 補助関数 Oldpath = addpath(fullfile(matlabroot,“例子”,“分阶段”,“主要”));numPed = 1;%行人实现的数量numBic = 1;%自行车运动员实现的数量numCar = 1;%汽车实现的数量[xPedRec,xBicRec,xCarRec,Tsamp] = helpbackscattersignals (numPed,numBic,numCar);[加速,T,F] = helperDopplerSignatures(xPedRec,Tsamp);[SBic,~,~] = helperDopplerSignatures(xBicRec,Tsamp);[SCar,~,~] = helperDopplerSignatures(xCarRec,Tsamp); このデタを深層学習用に処理する方法を示す例にいては,深層学習を使用した歩行者と自転車運転者の分類を参照してください。 パスを元に戻すには,関数 路径(媒介); |
从序列到标签分類 |
生成された波形 |
深層学習を使用したレ,ダ,波形の分類の例で使用されている補助関数 補助関数 Oldpath = addpath(fullfile(matlabroot,“例子”,“分阶段”,“主要”));[wav, modType] = helpergenerateradarwaves forms; このデタを深層学習用に処理する方法を示す例にいては,深層学習を使用したレ,ダ,波形の分類を参照してください。 パスを元に戻すには,関数 路径(媒介); |
从序列到标签分類 |
デタ | 説明 | タスク |
---|---|---|
HMDB(大規模人間動作デ,タベ,ス) (典型例) |
Hmbd51デ,タセットには,“飲む”,“走る”,“腕立て伏せ”など,51クラスの7000個のクリップから成る約2 GBのビデオデータが格納されています。 HMDB(大規模人間動作デ,タベ,ス)からhmdb51デタセットをダウンロドして解凍します。このデ,タセットは約2gbです。。 Rarファ电子邮箱ルを解凍した後,深層学習を使用したビデオの分類の例で使用されている補助関数 Oldpath = addpath(fullfile(matlabroot,“例子”,“nnet”,“主要”));dataFolder = fullfile(tempdir,“hmdb51_org”);[files,labels] = hmdb51Files(dataFolder); このデタを深層学習用に処理する方法を示す例にいては,深層学習を使用したビデオの分類を参照してください。 パスを元に戻すには,関数 路径(媒介); |
ビデオ分類 |
デタ | 説明 | タスク |
---|---|---|
工場レポ,ト |
工場レポ、トデ、タセットは、さまざまな属性(変数. ファereplicationル 文件名=“factoryReports.csv”;数据= readtable(文件名,“TextType”,“字符串”);textData = data.Description;labels = data.Category; このデタを深層学習用に処理する方法を示す例にいては,深層学習を使用したテキストデ,タの分類を参照してください。 |
テキスト分類,トピックモデリング |
シェ@ @クスピアのソネット |
ファereplicationル ファereplicationル 文件名=“sonnets.txt”;textData = fileread(文件名);
ソネットは2の空白文字でンデントされ,2の改行文字で区切られています。 textData = replace(textData,”“,"");textData = split(textData,[newline newline]);textData = textData(5:2:end); このデタを深層学習用に処理する方法を示す例にいては,深層学習を使用したテキストの生成を参照してください。 |
トピックモデリング,テキスト生成 |
arXivメタデ,タ |
arXiv APIはhttps://arxiv.orgに提出された科学分野の電子出版物のメタデ,タ(要旨や主題など)へのアクセスを提供します。詳細にいては,https://arxiv.org/help/apiを参照してください。 arXiv APIを使用して,数学論文から概要とカテゴリラベルのセットをaapl .ンポ.トします。 url =“https://export.arxiv.org/oai2?verb=ListRecords”+...“集=数学”+...“&metadataPrefix = arXiv”;选项= weboptions(“超时”, 160);代码= webread(url,options); 返されたXMLコドを解析してさらに多くのレコドをンポトする方法を示す例にいては,深層学習を使用した複数ラベルをもテキストの分類を参照してください。 |
テキスト分類,トピックモデリング |
古登堡计划の書籍 |
古登堡计划から数多くの書籍をダウンロ,ドできます。たとえば,関数 url =“https://www.gutenberg.org/files/11/11-h/11-h.htm”;代码= webread(url);
HTMLコ,ドには, tree = htmlTree(code);选择器=“p”;subtrees = findElement(树,选择器);
関数 textData = extractHTMLText(subtrees);textData (textData = ="") = [];
このデタを深層学習用に処理する方法を示す例にいては,深層学習を使用した単語単位のテキスト生成を参照してください。 |
トピックモデリング,テキスト生成 |
週末のアップデ,ト |
ファereplicationル 関数 文件名=“weekendUpdates.xlsx”;TBL =可读(文件名,“TextType”,“字符串”);textData = tbl.TextData; このデタを処理する方法を示す例にいては,分析文本中的情感(文本分析工具箱)を参照してください。 |
センチメント分析 |
ロ,マ数字 |
CSVファCSVル CSVファCSVル 文件名= fullfile(“romanNumerals.csv”);options = detectImportOptions(文件名,...“TextType”,“字符串”,...“ReadVariableNames”、假);选项。VariableNames = [“源”“目标”];选项。VariableTypes = [“字符串”“字符串”];数据=可读(文件名,选项); このデタを深層学習用に処理する方法を示す例にいては,アテンションを使用した序列对序列変換を参照してください。 |
序列对序列変換 |
財務レポ,ト |
証券取引委員会(SEC)は,电子数据收集、分析和检索(埃德加)APIを介した財務レポートへのアクセスを許可しています。詳細にいては,https://www.sec.gov/edgar/searchedgar/accessing-edgar-data.htmを参照してください。 このデ,タをダウンロ,ドするには,生成领域特定的情感词汇(文本分析工具箱)の例にサポトファルとして添付されている関数 年= 2019年;QTR = 4;maxLength = 2e6;textData = financeReports(year,qtr,maxLength); このデタを処理する方法を示す例にいては,生成领域特定的情感词汇(文本分析工具箱)を参照してください。 |
センチメント分析 |
デタ | 説明 | タスク |
---|---|---|
音声コマンド |
音声コマンドデ,タセット[18]は,12のクラス(是的、没有、在、从など)のいずれかのラベル,および不明なコマンドやバックグラウンドノイズに対応するクラスのラベルが付けられた約65000個のオーディオファイルで構成されています。 https://storage.googleapis.com/download.tensorflow.org/data/speech_commands_v0.01.tar.gzから音声コマンドデ,タセットをダウンロ,ドして解凍します。このデタセットは約1.4 gbです。。
dataFolder = tempdir;ads = audioDatastore(数据文件夹,...“IncludeSubfolders”,真的,...“FileExtensions”,“wav”,...“LabelSource”,“foldernames”); このデタを深層学習用に処理する方法を示す例にいては,深層学習を使用した音声コマンド認識を参照してください。 |
オ,ディオ分類,音声認識 |
Mozilla Common Voice |
Mozilla常见声音データセットは,録音音声および対応するテキストファイルで構成されています。デ,タには,年齢,性別,アクセントなど,人口統計のメタデ,タも含まれています。 https://voice.mozilla.org/からMozilla公共语音デ,タセットをダウンロ,ドして解凍します。このデタセットはオプンなデタセットであるため,時間がたにれて大きくなる可能性があります。2019年10月現在,このデ.タセットは約28 gbです。。 dataFolder = tempdir;ads = audioDatastore(fullfile(数据文件夹,“剪辑”));
このデタを深層学習用に処理する方法を示す例にいては,格鲁ネットワ,クを使用した性別の分類を参照してください。 |
オ,ディオ分類,音声認識 |
免费语音数字数据集 |
免费使用数字数据集には,2019年1月29日現在,4人の話者が英語で発話した0 ~ 9の数字の録音が2000件含まれています。このバージョンでは,2人の話者はアメリカ英語を話すネイティブスピーカー,他の2人の話者はそれぞれベルギーフランス語なまりとドイツ語なまりの英語を話す非ネイティブスピーカーです。デ,タは8000 Hzでサンプリングされます。 https://github.com/Jakobovski/free-spoken-digit-datasetから免费口语数字数据集(FSDD)の録音音声をダウンロードします。
dataFolder = fullfile(tempdir,“free-spoken-digit-dataset”,“录音”);ads = audioDatastore(dataFolder); このデタを深層学習用に処理する方法を示す例にいては,ウェ,ブレット散乱と深層学習を使用した数字音声認識を参照してください。 |
オ,ディオ分類,音声認識 |
柏林情感语言数据库 |
柏林情感语言数据库[19]には,10人の俳優によって話された535個の発話が含まれています。これらの発話では,怒り,退屈,嫌悪,不安/恐怖,幸福,悲しみ,中立のいずれかの感情が表されています。感情はテキストと無関係です。 ファル名は,話者id,発話されたテキスト,感情,およびバジョンを表すコドです。Webサイトには,コードを解釈するためのヒント,および話者に関する追加の情報(性別や年齢など)が記載されています。 http://emodb.bilderbar.info/index-1280.htmlから,柏林情感言语数据库をダウンロ,ドします。このデタセットは約40 MBです。。
dataFolder = tempdir;ads = audioDatastore(fullfile(数据文件夹,“wav”));
このデタを深層学習用に処理する方法を示す例にいては,音声感情認識を参照してください。 |
オ,ディオ分類,音声認識 |
TUT声学场景2017 |
图坦卡蒙声学场景2017,开发数据集およびTUT声学场景2017,评估数据集から,TUT声学场景2017デ,タセット[20]をダウンロ,ドして解凍します。 このデタセットは15の音響シン(“バス”,"自動車"、“図書館”など)から取得した10秒間のオ,ディオセグメントで構成されています。 このデタを深層学習用に処理する方法を示す例にいては,後期融合を使用した音響シ,ン認識を参照してください。 |
音響シ,ン分類 |
梅萨罗斯,安娜玛利亚,托尼·海托拉,还有图马斯·维尔塔宁。声场景分类:DCASE 2017挑战赛参赛作品概述国际声学信号增强研讨会论文集(2018):
411 - 415。
[1] Lake, Brenden M., Ruslan Salakhutdinov, Joshua B. Tenenbaum。“通过概率程序归纳的人类水平概念学习”科学350,不是。6266(2015年12月11日):1332-38。https://doi.org/10.1126/science.aab3050。
TensorFlow团队。“花”https://www.tensorflow.org/datasets/catalog/tf_flowers
[3] Kat,郁金香,图片,https://www.flickr.com/photos/swimparallel/3455026124.创作共用许可证(CC BY)。
[4] Rob Bertholf,向日葵,图片,https://www.flickr.com/photos/robbertholf/20777358950.创作共用2.0通用许可。
[5] Parvin, Roses, image,https://www.flickr.com/photos/55948751@N00.创作共用2.0通用许可。
约翰·哈斯拉姆,蒲公英,图片,https://www.flickr.com/photos/foxypar4/645330051.创作共用2.0通用许可。
[7]克里哲夫斯基,亚历克斯。“从微小图像中学习多层特征。”硕士论文,多伦多大学,2009年。https://www.cs.toronto.edu/%7Ekriz/learning-features-2009-TR.pdf.
[8] Brostow, Gabriel J., Julien Fauqueur和Roberto Cipolla。视频中的语义对象类:一个高清地面真相数据库。模式识别信30,没有。2(2009年1月):88-97。https://doi.org/10.1016/j.patrec.2008.04.005
Kemker, Ronald, Carl Salvaggio和Christopher Kanan。用于语义分割的高分辨率多光谱数据集[c], 2017年3月6日。https://arxiv.org/abs/1703.01918
Isensee, Fabian, Philipp Kickingereder, Wolfgang Wick, Martin Bendszus和Klaus H. Maier-Hein。“脑肿瘤分割和放射组学生存预测:对BRATS 2017挑战的贡献。”《脑损伤:胶质瘤、多发性硬化症、中风和创伤性脑损伤》,由Alessandro Crimi、Spyridon Bakas、Hugo Kuijf、Bjoern Menze和Mauricio Reyes编辑,10670:287-97。瑞士湛:施普林格国际出版社,2018年。https://doi.org/10.1007/978-3-319-75238-9_25
[11] Ehteshami Bejnordi, Babak, Mitko Veta, Paul Johannes van Diest, Bram van Ginneken, Nico Karssemeijer, Geert Litjens, Jeroen A. W. M. van der Laak等,“深度学习算法用于检测乳腺癌女性淋巴结转移的诊断评估。”JAMA 318,不是。22(2017年12月12日):2199。https://doi.org/10.1001/jama.2017.14585
[12]工藤,美一,富山俊,新保真。“使用穿过区域的多维曲线分类”模式识别信20,没有。11-13(1999年11月):1103-11。https://doi.org/10.1016/s0167 - 8655 (99) 00077 - x
[13]工藤,美一,富山俊,新保真。日语元音数据集。由UCI机器学习库分发。https://archive.ics.uci.edu/ml/datasets/Japanese+Vowels
Saxena, Abhinav, Kai Goebel。涡扇发动机退化仿真数据集NASA艾姆斯预测数据仓库https://ti.arc.nasa.gov/tech/dash/groups/pcoe/prognostic-data-repository/美国宇航局艾姆斯研究中心,莫菲特场,加利福尼亚州
Rieth, Cory A., Ben D. Amsel, Randy Tran和Maia B. Cook。附加田纳西伊士曼过程模拟数据异常检测评估。哈佛数据厌恶,版本1,2017。https://doi.org/10.7910/DVN/6C3JR1.
Goldberger, Ary L., Luis A. N. Amaral, Leon Glass, Jeffery M. Hausdorff, Plamen Ch. Ivanov, Roger G. Mark, Joseph E. Mietus, George B. Moody,彭仲康和H. Eugene Stanley。“PhysioBank, PhysioToolkit,和PhysioNet:复杂生理信号新研究资源的组成部分。”《循环101》第23期,2000年,第e215-e220页。https://circ.ahajournals.org/content/101/23/e215.full
[17]拉古纳、巴勃罗、罗杰·g·马克、阿里·l·戈德伯格和乔治·b·穆迪。心电图QT和其他波形间隔测量算法评估数据库心脏病学24,1997,pp. 673-676。
狱长P。“语音命令:用于单词语音识别的公共数据集”,2017年。可以从http://download.tensorflow.org/data/speech_commands_v0.01.tar.gz.版权所有谷歌2017。语音命令数据集是在创作共用属性4.0许可下授权的,可在这里获得:https://creativecommons.org/licenses/by/4.0/legalcode.
[19] Burkhardt, Felix, Astrid Paeschke, Melissa A. Rolfes, Walter F. Sendlmeier和Benjamin Weiss。"德语情感语言数据库"2005年国际语言会议论文集.里斯本,葡萄牙:国际语音交流协会,2005年。
Mesaros, Annamaria, Toni Heittola和Tuomas Virtanen。声场景分类:DCASE 2017挑战赛参赛作品概述2018年第16届国际声学信号增强研讨会(IWAENC),第411-415页。IEEE 2018。