主要内容

このペ,ジの翻訳は最新ではありません。ここをクリックして,英語の最新版を参照してください。

深層学習用のデ,タセット

これらのデ,タセットを使用して,深層学習の応用を開始します。

イメージデータセット

デ,タセット 説明 タスク

数字

数字デタセットは,10000個の手書き数字の合成グレスケルメジで構成されています。各イメージは28 x 28ピクセルで,イメージが表す数字(0 ~ 9)を示すラベルが関連付けられています。各▪▪メ▪▪ジには特定な角度の回転が付けられています。。

関数digitTrain4DArrayDatadigitTest4DArrayDataを使用して,。

[XTrain,YTrain,anglesTrain] = digitTrain4DArrayData;[XTest,YTest,anglesTest] = digitTest4DArrayData;

このデタを深層学習用に処理する方法を示す例にいては,深層学習における学習の進行状況の監視および回帰用の畳み込みニュ,ラルネットワ,クの学習を参照してください。

@ @ @ @ @ @ @ @ @ @ @ @ @ @ @ @ @ @

関数imageDatastoreを使用して数字データをイメージデータストアとして読み込み,イメージデータが格納されているフォルダーを指定します。

dataFolder = fullfile(toolboxdir(“nnet”),“nndemos”“nndatasets”“DigitDataset”);imds = imageDatastore(数据文件夹,...“IncludeSubfolders”,真的,...“LabelSource”“foldernames”);

このデタを深層学習用に処理する方法を示す例にいては,分類用のシンプルな深層学習ネットワ,クの作成を参照してください。

メ,ジ分類

MNIST

(典型例)

70000年MNISTデータセットは個の手書き数字で構成されていて,60000個のイメージをもつ学習用区画と10000個のイメージをもつテスト用区画に分かれています。各イメージは28 x 28ピクセルで,イメージが表す数字(0 ~ 9)を示すラベルが関連付けられています。

Mnistファ苹果苹果ルをhttp://yann.lecun.com/exdb/mnist/からダウンロ,ドし,デ,タセットをワ,クスペ,スに読み込みます。ファereplicationルからMATLAB配列としてデータを読み込むには、ファイルを解凍して作業ディレクトリに保存し、変分自己符号化器(vae)の学習によるメジ生成の例で使用されている補助関数processImagesMNISTprocessLabelsMNISTを使用します。

Oldpath = addpath(fullfile(matlabroot,“例子”“nnet”“主要”));filenameImagesTrain =“train-images.idx3-ubyte”;filenameLabelsTrain =“train-labels.idx1-ubyte”;filenameImagesTest =“t10k-images.idx3-ubyte”;filenameLabelsTest =“t10k-labels.idx1-ubyte”;XTrain = processImagesMNIST(filenameImagesTrain);YTrain = processLabelsMNIST(filenameLabelsTrain);XTest = processImagesMNIST(filenameImagesTest);YTest = processLabelsMNIST(filenameLabelsTest);

このデタを深層学習用に処理する方法を示す例にいては,変分自己符号化器(vae)の学習によるメジ生成を参照してください。

パスを元に戻すには,関数路径を使用します。

路径(媒介);

メ,ジ分類

Omniglot

Omniglotデータセットには50個のアルファベットの文字セットが含まれていて,そのうち30セットが学習用に,20セットがテスト用に分けられています。それぞれのアルファベットには,Ojibwe(カナダ先住民文字)の14個の文字から曾の55個の文字まで,数多くの文字が含まれています。そして,それぞれの文字には20個の手書きの観測値があります。

https://github.com/brendenlake/omniglotからOmniglotデ,タセット[1]をダウンロ,ドして解凍します。downloadFolderをデ,タの場所に設定します。

downloadFolder = tempdir;url =“https://github.com/brendenlake/omniglot/raw/master/python”;urlTrain = url +“/ images_background.zip”;urlTest = url +“/ images_evaluation.zip”;fileametrain = fullfile(下载文件夹,“images_background.zip”);filenameTest = fullfile(下载文件夹,“images_evaluation.zip”);dataFolderTrain = fullfile(下载文件夹,“images_background”);dataFolderTest = fullfile(下载文件夹,“images_evaluation”);如果~存在(dataFolderTrain“dir”)流(“下载Omniglot训练数据集(4.5 MB)…”) websave (filenameTrain urlTrain);解压缩(filenameTrain downloadFolder);流(“完成。\ n”结束如果~存在(dataFolderTest“dir”)流(“下载Omniglot测试数据(3.2 MB)…”) websave (filenameTest urlTest);解压缩(filenameTest downloadFolder);流(“完成。\ n”结束

学習デタとテストデタをメジデタストアとして読み込むには,関数imageDatastoreを使用します。ファereplicationル名からラベルを抽出して标签プロパティを設定し,ラベルを手動で指定します。

imdsTrain = imageDatastore(dataFolderTrain,...“IncludeSubfolders”,真的,...“LabelSource”“没有”);files = imdsTrain.Files;Parts = split(files,filesep);标签= join(parts(:,(end-2):(end-1)),“_”);imdsTrain。标签= categorical(labels); imdsTest = imageDatastore(dataFolderTest,...“IncludeSubfolders”,真的,...“LabelSource”“没有”);files = imdsTest.Files;Parts = split(files,filesep);标签= join(parts(:,(end-2):(end-1)),“_”);imdsTest。标签= categorical(labels);

このデタを深層学習用に処理する方法を示す例にいては,シャムネットワクの学習とメジの比較を参照してください。

メ,ジ類似度

:[3][4][5][6]

花のデタセットには,5のクラス(“デジ”,“タンポポ”,“バラ”,“ヒマワリ”,および"チュリップ")に属する3670個の花のメジが含まれています。

http://download.tensorflow.org/example_images/flower_photos.tgzから花のデ,タセット[2]をダウンロ,ドして解凍します。このデ,タセットは約218 MBです。。downloadFolderをデ,タの場所に設定します。

url =“http://download.tensorflow.org/example_images/flower_photos.tgz”;downloadFolder = tempdir;文件名= fullfile(下载文件夹,“flower_dataset.tgz”);dataFolder = fullfile(下载文件夹,“flower_photos”);如果~存在(dataFolder“dir”)流("正在下载Flowers数据集(218 MB)…") websave(文件名,url);解压(文件名,downloadFolder)流(“完成。\ n”结束

関数imageDatastoreを使用してデータをイメージデータストアとして読み込み,イメージデータが格納されているフォルダーを指定します。

imds = imageDatastore(数据文件夹,...“IncludeSubfolders”,真的,...“LabelSource”“foldernames”);

このデタを深層学習用に処理する方法を示す例にいては,敵対的生成ネットワ,ク(gan)の学習を参照してください。

メ,ジ分類

食品▪▪メ▪▪ジのサンプル

食品▪▪メ▪▪ジのサンプルデ▪タセットには,9▪▪のクラス(“シ,ザ,サラダ”,“カプレ,ゼサラダ”,“フラ电子邮箱ドポテト”,“グリ,クサラダ”,“ハンバ,ガ,”,“ホットドッグ”,“ピザ”,“刺身”,および“寿司”)に属する978枚の写真が含まれています。

//www.tatmou.com/金宝appsupportfiles/nnet/data/ExampleFoodImageDataset.zipから食品メジのサンプルデタセットをダウンロドして解凍します。このデタセットは約77 MBです。。downloadFolderをデ,タの場所に設定します。

url =“//www.tatmou.com/金宝appsupportfiles/nnet/data/ExampleFoodImageDataset.zip”;downloadFolder = tempdir;文件名= fullfile(下载文件夹,“ExampleFoodImageDataset.zip”);dataFolder = fullfile(下载文件夹,“ExampleFoodImageDataset”);如果~存在(dataFolder“dir”)流(“下载示例食品图像数据集(77 MB)…”) websave(文件名,url);解压缩(文件名,downloadFolder);流(“完成。\ n”结束

このデタを深層学習用に処理する方法を示す例にいては,Tsneを使用したネットワ,クの動作の表示を参照してください。

メ,ジ分類

CIFAR-10

(典型例)

Cifar-10デ,タセットには,10個のクラス("飛行機"、"自動車"、"鳥"、"猫"、"鹿"、"犬"、"蛙"、"馬"、“船”,および“トラック”)に属する32 x 32ピクセルのカラーイメージが60000個含まれています。

1。このデータセットは,50000個のイメージから成る学習セットと10000個のイメージから成るテストセットに分かれています。このデータセットは,新しいイメージ分類モデルのテストに最も広く使用されているデータセットのひとつです。

https://www.cs.toronto.edu/%7Ekriz/cifar-10-matlab.tar.gzからcifar-10デ,タセット[7]をダウンロ,ドして解凍します。このデ,タセットは約175 MBです。。downloadFolderをデ,タの場所に設定します。

url =“https://www.cs.toronto.edu/ ~ kriz / cifar-10-matlab.tar.gz”;downloadFolder = tempdir;文件名= fullfile(下载文件夹,“cifar-10-matlab.tar.gz”);dataFolder = fullfile(下载文件夹,“cifar-10-batches-mat”);如果~存在(dataFolder“dir”)流("下载CIFAR-10数据集(175mb)…");websave(文件名、url);解压(文件名,downloadFolder);流(“完成。\ n”结束
イメージ分類用の残差ネットワークの学習の例で使用されている補助関数loadCIFARDataを使用して,このデ,タを数値配列に変換します。
Oldpath = addpath(fullfile(matlabroot,“例子”“nnet”“主要”));[XTrain,YTrain,XValidation,YValidation] = loadCIFARData(downloadFolder);

このデタを深層学習用に処理する方法を示す例にいては,イメージ分類用の残差ネットワークの学習を参照してください。

パスを元に戻すには,関数路径を使用します。

路径(媒介);

メ,ジ分類

MathWorks®营销上

75年これは個のMathWorksの商品イメージから成る小さなデータセットであり,5つの異なるクラス(“帽”,“立方体”,“打牌”,“螺丝刀”,および“火炬”)に属します。このデタセットを使用して転移学習やメジ分類を素早く試すことができます。

イメージのサイズは227 x 227 x 3です。

MathWorks Merchデ,タセットを解凍します。

文件名=“MerchData.zip”;dataFolder = fullfile(tempdir,“MerchData”);如果~存在(dataFolder“dir”解压缩(文件名,tempdir);结束

関数imageDatastoreを使用してデータをイメージデータストアとして読み込み,イメージデータが格納されているフォルダーを指定します。

imds = imageDatastore(数据文件夹,...“IncludeSubfolders”,真的,...“LabelSource”“foldernames”);

このデタを深層学習用に処理する方法を示す例にいては,転移学習入門および新しいメジを分類するための深層学習ネットワクの学習を参照してください。

メ,ジ分類

CamVid

CamVidデータセットは,運転中の車両から得られた路上レベルのビューが含まれるイメージコレクションです。デタセットは,メジのセマンティックセグメンテションを行うネットワクの学習に役立ます。また,"車"、"歩行者"、“道路”を含む32個のセマンティッククラスにいてピクセルレベルのラベルを提供します。

イメージのサイズは720 x 960 x 3です。

http://web4.cs.ucl.ac.uk/staff/g.brostow/MotionSegRecDataからCamVidデ,タセット[8]をダウンロ,ドして解凍します。このデ,タセットは約573 MBです。。downloadFolderをデ,タの場所に設定します。

downloadFolder = tempdir;url =“http://web4.cs.ucl.ac.uk/staff/g.brostow/MotionSegRecData”urlImages = url +“/文件/ 701 _stillsraw_full.zip”;urlLabels = url +“/数据/ LabeledApproved_full.zip”;dataFolder = fullfile(下载文件夹,“CamVid”);dataFolderImages = fullfile(数据文件夹,“图片”);dataFolderLabels = fullfile(数据文件夹,“标签”);filenameLabels = fullfile(数据文件夹,“labels.zip”);fileameimages = fullfile(数据文件夹,“images.zip”);如果~存在(filenameLabels“文件”) || ~exist(imagesZip,“文件”mkdir(dataFolder)“下载CamVid数据集图像(557 MB)…”);websave (filenameImages urlImages);解压缩(filenameImages dataFolderImages);流(“完成。\ n”)流(“下载CamVid数据集标签(16mb)…”);websave (filenameLabels urlLabels);解压缩(filenameLabels dataFolderLabels);流(“完成。\ n”结束

関数pixelLabelDatastoreを使用してデータをピクセルラベルデータストアとして読み込み,ラベルデータ,クラス,およびラベルIDが格納されているフォルダーを指定します。学習を容易にするために,データセットの元の32個のクラスを11個のクラスにグループ化します。ラベルidを取得するには,深層学習を使用したセマンティックセグメンテ,ションの例で使用されている補助関数camvidPixelLabelIDsを使用します。

Oldpath = addpath(fullfile(matlabroot,“例子”“deeplearning_shared”“主要”));imds = imageDatastore(dataFolderImages,“IncludeSubfolders”,真正的);类= [“天空”“建筑”“极”“路”“路面”“树”...“SignSymbol”“篱笆”“汽车”“行人”“自行车”];labelIDs = camvidPixelLabelIDs;pxds = pixelLabelDatastore(dataFolderLabels,classes,labelIDs);

このデタを深層学習用に処理する方法を示す例にいては,深層学習を使用したセマンティックセグメンテ,ションを参照してください。

パスを元に戻すには,関数路径を使用します。

路径(媒介);

セマンティックセグメンテ,ション

車両

車両データセットは,1個または2個のラベル付けされた車両インスタンスを含む295個のイメージで構成されています。この小さなデータセットはYOLO-v2の学習手順を調べるうえで役立ちますが,実際にロバストな検出器に学習させるにはラベル付けされたイメージがより多く必要になります。

イメージのサイズは720 x 960 x 3です。

車両デ,タセットを解凍します。dataFolderをデ,タの場所に設定します。

文件名=“vehicleDatasetImages.zip”;dataFolder = fullfile(tempdir,“vehicleImages”);如果~存在(dataFolder“dir”解压缩(文件名,tempdir);结束

解凍した垫ファイルから,ファイル名と境界ボックスの表としてデータセットを読み込み,ファイル名を絶対ファイルパスに変換します。

数据=负载(“vehicleDatasetGroundTruth.mat”);vehicleDataset = data.vehicleDataset;vehicleDataset。imageFilename = fullfile(tempdir,vehicleDataset.imageFilename);

関数imageDatastoreboxLabelDatastoreを使用して,イメージが格納されたイメージデータストアと境界ボックスが格納されたボックスラベルデータストアをそれぞれ作成します。関数结合を使用して,得られたデ,タストアを結合します。

filenamesImages = vehicleDataset.imageFilename;tblBoxes = vehicleDataset(:,“汽车”);imds = imageDatastore(filenamesImages);blds = boxLabelDatastore(tblBoxes);CDS = combine(imds,blds);

このデタを深層学習用に処理する方法を示す例にいては,YOLO v2深層学習を使用したオブジェクトの検出を参照してください。

オブジェクトの検出

RIT-18

哈姆林海滩州立公园的航拍照片,彩色像素标签覆盖,显示草地、树木、沙滩、沥青和其他类别的区域

RIT-18データセットには,ニューヨーク州にあるハムリンビーチ州立公園の上空をドローンで撮影したイメージデータが含まれています。このデ,タには,18個のオブジェクトクラスラベル("路面標示"、"樹木"、“ビル”など)の付いた,ラベル付き学習セット,検証セットおよびテストセットが含まれます。

https://www.cis.rit.edu/%7Ermk6217/rit18_data.matからrit-18デ,タセット[9]をダウンロ,ドします。このデタセットは約3gbです。。downloadFolderをデ,タの場所に設定します。

downloadFolder = tempdir;url =“http://www.cis.rit.edu/ ~ rmk6217 / rit18_data.mat”;文件名= fullfile(下载文件夹,“rit18_data.mat”);如果~存在(文件名,“文件”)流(“正在下载哈姆林海滩数据集(3gb)…”);websave(文件名、url);流(“完成。\ n”结束

このデタを深層学習用に処理する方法を示す例にいては,深層学習を使用したマルチスペクトルメジのセマンティックセグメンテションを参照してください。

セマンティックセグメンテ,ション

有钱的孩子

人脑轴向切片,彩色像素标签覆盖,显示正常组织和肿瘤组织区域

小鬼データセットには,脳腫瘍,すなわち最も一般的な原発性悪性脳腫瘍である神経膠腫のMRIスキャンが格納されています。

750年データセットには個の4次元ボリュームが格納されており,それぞれが3次元イメージのスタックを表します。各4次元ボリュームのサイズは240 x 240 x 155 x 4であり,最初の3つの次元は3次元ボリュームイメージの高さ,幅,奥行に対応します。4番目の次元は異なるスキャンモダリティに対応します。このデータセットは,ボクセルラベルを含む484個の学習ボリュームと266個のテストボリュームに分割されています。

BraTSデ,タセット[10]を格納するディレクトリを作成します。

dataFolder = fullfile(tempdir,“小鬼”);如果~存在(dataFolder“dir”mkdir (dataFolder);结束

医疗细分十项全能(下载数据)でリンクをクリックして小鬼データをダウンロードします。“Task01_BrainTumour.tar”ファイルをダウンロードします。このデ,タセットは約7gbです。。

変数dataFolderで指定されたディレクトリにtarファescルを解凍します。正常に解凍された場合,dataFolderにはimagesTrimagesTs,およびlabelsTrという3のサブカテゴリがあるTask01_BrainTumourという名前のディレクトリが含まれています。

このデタを深層学習用に処理する方法を示す例にいては,深層学習を使用した脳腫瘍の3次元セグメンテションを参照してください。

セマンティックセグメンテ,ション

Camelyon16

6块正常组织样本

Camelyon16チャレンジのデータには,2つの独立したソースによるリンパ節のWSIが合計400個含まれており,270個の学習イメージと130個のテストイメージに分かれています。WSIは11レベルのピラミッド構造をもつストリップ形式气管无名动脉瘘管的のファイルとして格納されています。

学習データセットは,正常なリンパ節の159個のスライドガラス標本全体のイメージ(WSI)と腫瘍組織と正常組織を含むリンパ節の111個のWSIで構成されています。通常,腫瘍組織の割合は正常組織に比べるとごくわずかです。腫瘍メジには病変境界のグラウンドトゥルス座標が付属しています。

Camelyon16デ,タセット[11]を格納するディレクトリを作成します。

dataFolderTrain = fullfile(tempdir,“Camelyon16”“培训”);dataFolderNormalTrain = fullfile(dataFolderTrain,“正常”);dataFolderTumorTrain = fullfile(dataFolderTrain,“肿瘤”);dataFolderAnnotationsTrain = fullfile(dataFolderTrain,“lesion_annotations”);如果~存在(dataFolderTrain“dir”mkdir (dataFolderTrain);mkdir (dataFolderNormalTrain);mkdir (dataFolderTumorTrain);mkdir (dataFolderAnnotationsTrain);结束

Camelyon17で最初の[CAMELYON16数据集]リンクをクリックし,CAMELYON16データセットをダウンロードします。“培训”ディレクトリを開き,以下の手順に従います。

  • "lesion_annotations.zip"ファaapl .ルをダウンロ.ドします。変数dataFolderAnnotationsTrainで指定されたディレクトリにファ@ @ルを解凍します。

  • “正常”ディレクトリを開きます。変数dataFolderNormalTrainで指定されたディレクトリにメジをダウンロドします。

  • “肿瘤”ディレクトリを開きます。変数dataFolderTumorTrainで指定されたディレクトリにメジをダウンロドします。

このデ,タセットは約2gbです。。

このデタを深層学習用に処理する方法を示す例にいては,blockedImageおよび深層学習を使用した,大きな多重解像度を参照してください。

▪▪▪▪▪▪

上下文中的公共对象(COCO)

(典型例)

Coco 2014学習メジデタセットは,82,783個のメジで構成されています。注釈デタには,各メジごとに最低5の対応するキャプションが格納されています。

Cocoデタセットを格納するディレクトリを作成します。

dataFolder = fullfile(tempdir,“可可”);如果~存在(dataFolder“dir”mkdir (dataFolder);结束

https://cocodataset.org/#downloadで[2014火车图片]と[2014火车/ Val注解]のリンクをクリックし,可可2014の学習イメージとキャプションをそれぞれダウンロードして解凍します。dataFolderで指定したフォルダ,にデ,タを保存します。

関数jsondecodeを使用して,ファcaptions_train2014.jsonからキャプションを抽出します。

文件名= fullfile(数据文件夹,“annotations_trainval2014”“注释”...“captions_train2014.json”);STR = fileread(文件名);数据= jsondecode(str);

構造体の注释フィルドには,メジキャプショニングに必要なデタが格納されます。

このデタを深層学習用に処理する方法を示す例にいては,アテンションを使用した▪▪メ▪▪ジキャプションの生成を参照してください。

メ,ジキャプションの生成

IAPR TC-12

西班牙塞维利亚阿尔卡扎尔皇宫的一堵墙和花园

(典型例)

Iapr tc-12ベンチマ,クは,20000個の静止した自然,,,。このデ,タセットには,人物,動物,都市などの写真が含まれます。デタファルのサズは約1.8 gbです。

Iapr tc-12デ,タセットをダウンロ,ドします。

dataDir = fullfile(tempdir,“iaprtc12”);url =“http://www-i6.informatik.rwth-aachen.de/imageclef/resources/iaprtc12.tgz”如果~存在(dataDir“dir”)流(“下载IAPR TC-12数据集(1.8 GB)…\n”);试一试解压(url, dataDir);在某些Windows机器上,untar命令会出错。tgz%的文件。重命名为.tg,然后重试。文件名= fullfile(tempdir,“iaprtc12.tg”);websave(文件名、url);解压(文件名,dataDir);结束流(“做。\ n \ n”);结束

関数imageDatastoreを使用してデタをメジデタストアとして読み込みます。。

imagadir = fullfile(dataDir,“图片”) exts = {“jpg”bmp格式的“使用”};imds = imageDatastore(imageDir,...“IncludeSubfolders”,真的,...“FileExtensions”ext);

このデタを深層学習用に処理する方法を示す例にいては,深層学習を使用した単一▪▪メ▪▪ジ超解像処理を参照してください。

图片对图片回帰

苏黎世RAW转RGB

一对RAW和RGB图像补丁的街道场景在苏黎世

苏黎世原始RGBデータセットには,サイズが448 x 448の,空間的にレジストレーションされた生学習イメージパッチおよびRGB学習イメージパッチが48043ペア登録されています。このデタセットには2の異なるテストセットが格納されています。一方のテストセットは,サイズが448 x 448の,空間的にレジストレーションされた原始イメージパッチおよびRGBイメージパッチ1204ペアで構成されています。もう一方のテストセットはレジストレーションされていない高解像度生イメージおよびRGBイメージで構成されています。このデタセットのサズは22 gbです。

デ,タセットを格納するディレクトリを作成します。

imageDir = fullfile(tempdir,“ZurichRAWToRGB”);如果~存在(imageDir“dir”mkdir (imageDir);结束
デ,タセットをダウンロ,ドするには,苏黎世RAW到RGB数据集フォ,ムを使用してアクセスを依頼します。変数imageDirで指定されたディレクトリにデ,タを解凍します。解凍に成功すると,imageDirにはfull_resolution测验,および火车という名前の3のディレクトリが格納されています。< p >

このデタを深層学習用に処理する方法を示す例にいては,深層学習を使用したカメラの生デタ処理パプランの構築を参照してください。

图片对图片回帰

時系列と信号のデ,タセット

デタ 説明 タスク

日本的元音

日语元音デ,タセット[12][13]には,さまざまな話者による日本語母音の発話を表す前処理済みのシ,ケンスが含まれています。

XTrainXTestは,次元12の可変長のシ,ケンスが含まれるcell配列です。YTrain欧美は,9人の話者に対応する1 ~ 9のラベルから成る分类ベクトルです。XTrainのエントリは行列で,行数が12(特徴ごとに1行)で,列数が可変(タイムステップごとに1列)です。XTestは,次元12の可変長のシ,ケンスが370個含まれるcell配列です。

関数japaneseVowelsTrainDatajapaneseVowelsTestDataを使用して,数値シーケンスが格納されたインメモリ细胞配列として日本元音データセットを読み込みます。

[XTrain,YTrain] =日本evowelstraindata;[XTest,YTest] =日本evowelstestdata;

このデタを深層学習用に処理する方法を示す例にいては,深層学習を使用したシ,ケンスの分類を参照してください。

从序列到标签分類

水ぼうそう

水ぼうそうデータセットには,月に対応するタイムステップと発生件数に対応する値を含む1つの時系列が含まれています。出力はcell配列で,その各要素は1のタムステップです。

関数chickenpox_datasetを使用して水ぼうそうデ,タを単一の数値シ,ケンスとして読み込みます。デ,タを行ベクトルに形状変更します。

数据= chickenpox_dataset;数据= [Data {:}];

このデタを深層学習用に処理する方法を示す例にいては,深層学習を使用した時系列予測を参照してください。

時系列予測

人の行動

行動データセットには,体に装着したスマートフォンから得られたセンサーデータの7つの時系列が含まれています。各シケンスには3の特徴があり,。3 .。

人の行動のデ,タセットを読み込みます。

dataTrain = load(“HumanActivityTrain”);dataTest = load(“HumanActivityTest”);XTrain = dataTrain.XTrain;YTrain = dataTrain.YTrain;XTest = dataTest.XTest;YTest = dataTest.YTest;

このデタを深層学習用に処理する方法を示す例にいては,深層学習を使用した序列对序列分類を参照してください。

序列对序列分類

涡扇发动机退化仿真

涡扇发动机退化仿真デ,タセット[14]の各時系列は,それぞれ異なるエンジンを表します。開始時点では,各エンジンの初期摩耗の程度や製造上の差異は不明です。各時系列の開始時,エンジンは正常に運転していますが,時系列のある時点で故障が発生します。学習セットでは,システム障害が発生するまで,故障の規模が大きくなります。

このデータには,スペースで区切られた26列の数値のあるzip圧縮されたテキストファイルが含まれています。各行は1回の運転サクルの間に取得されたデタのスナップショットで,各列は異なる変数です。各列は以下に対応します。

  • 列1 -ユニット番号

  • 列2 -サescクル単位の時間

  • 列3 ~ 5 -運転設定

  • 列6 ~ 26 -センサ,測定値1 ~ 21

涡扇发动机退化模拟データセットを格納するディレクトリを作成します。

dataFolder = fullfile(tempdir,“涡扇”);如果~存在(dataFolder“dir”mkdir (dataFolder);结束

涡扇发动机退化仿真数据集をhttps://ti.arc.nasa.gov/tech/dash/groups/pcoe/prognostic-data-repository/からダウンロ,ドして解凍します。

ファereplicationルCMAPSSData.zipからデ,タを解凍します。

文件名=“CMAPSSData.zip”;解压缩(文件名,dataFolder)

補助関数processTurboFanDataTrainprocessTurboFanDataTestを使用して,学習デ,タとテストデ,タをそれぞれ読み込みます。これらの関数は,深層学習を使用した序列对序列回帰の例で使用されています。

Oldpath = addpath(fullfile(matlabroot,“例子”“nnet”“主要”));fileamepredictors = fullfile(数据文件夹,“train_FD001.txt”);[XTrain,YTrain] = processTurboFanDataTrain(filenamePredictors);fileamepredictors = fullfile(数据文件夹,“test_FD001.txt”);fileameresponses = fullfile(数据文件夹,“RUL_FD001.txt”);[XTest,YTest] = processTurboFanDataTest(filenamePredictors, filenamerresponses);

このデタを深層学習用に処理する方法を示す例にいては,深層学習を使用した序列对序列回帰を参照してください。

パスを元に戻すには,関数路径を使用します。

路径(媒介);

序列对序列回帰,予知保全

PhysioNet 2017挑战赛

PhysioNet 2017挑战赛デ,タセット[16]は,300 Hzでサンプリングされ,専門家グループによって次の4つの別々のクラスに分けられた,一連の心電図(ECG)記録で構成されています。正常(N), AFib (A),その他の律動(O),およびノ` `ズを含む録音(~)。

長短期記憶ネットワクを使用したecg信号の分類の例で使用されているReadPhysionetDataスクリプトを使用して,生理网2017年挑战データセットをダウンロードして解凍します。

このデタセットは約95 MBです。。

Oldpath = addpath(fullfile(matlabroot,“例子”“deeplearning_shared”“主要”));ReadPhysionetData data = load(“PhysionetData.mat”)信号=数据。信号;labels = data.Labels;

このデタを深層学習用に処理する方法を示す例にいては,長短期記憶ネットワクを使用したecg信号の分類を参照してください。

パスを元に戻すには,関数路径を使用します。

路径(媒介);

从序列到标签分類

田纳西伊士曼过程(TEP)シミュレ,ション

このデータセットは,田纳西伊士曼过程(TEP)のシミュレーションデータから変換された垫ファイルで構成されています。

MathWorksのサポートファイルサイトから,田纳西伊士曼过程(TEP)シミュレーションデータセット[15]をダウンロドします(免責事項を参照してください)。このデ,タセットには,次の4 .。故障なしの学習,故障なしのテスト,故障ありの学習,故障ありのテスト各ファ▪▪ルを別々にダウンロ▪▪ドします。

このデタセットは約1.7 gbです。。

url金宝appSupportFiles =“//www.tatmou.com/金宝appsupportfiles/predmaint”;url = url金宝appSupportFiles +“/ chemical-process-fault-detection-data / faultytesting.mat”;流(“正在下载TEP故障测试数据(1gb)…”) websave (“faultytesting.mat”url);流(“完成。\ n”) url = url金宝appSupportFiles +“/ chemical-process-fault-detection-data / faultytraining.mat”;流(“正在下载TEP故障训练数据(613 MB)…”) websave (“faultytraining.mat”url);流(“完成。\ n”) url = url金宝appSupportFiles +“/ chemical-process-fault-detection-data / faultfreetesting.mat”;流(“下载TEP无故障测试数据(69 MB)…”) websave (“faultfreetesting.mat”url);流(“完成。\ n”) url = url金宝appSupportFiles +“/ chemical-process-fault-detection-data / faultfreetraining.mat”;流(“下载TEP无故障训练数据(36 MB)…”) websave (“faultfreetraining.mat”url);流(“完成。\ n”

ダウンロドしたファルをmatlab®ワ,クスペ,スに読み込みます。

负载(“faultfreetesting.mat”);负载(“faultfreetraining.mat”);负载(“faultytesting.mat”);负载(“faultytraining.mat”);

このデタを深層学習用に処理する方法を示す例にいては,深層学習を使用した化学的プロセスの故障検出を参照してください。

从序列到标签分類

PhysioNet心电图分割

PhysioNet ECGセグメンテ,ションデ,タセット[16][17]は,合計105人の患者からの約15分間のecgの記録で構成されています。各記録を取得するために,検査員は患者の胸部の異なる場所に2つの電極を配置して,2チャネル信号にします。このデータベースは,自動化されたエキスパートシステムによって生成される信号領域ラベルを提供します。

https://github.com/mathworks/physionet_ECG_segmentationからQT_Database-master.zipzipファイルをダウンロードして,生理网心电图分割データセットをダウンロードします。このデタセットは約72 MBです。。downloadFolderをデ,タの場所に設定します。

downloadFolder = tempdir;url =“https://github.com/mathworks/physionet_ECG_segmentation/raw/master/QT_Database-master.zip”;文件名= fullfile(下载文件夹,“QT_Database-master.zip”);dataFolder = fullfile(下载文件夹,“QT_Database-master”);如果~存在(dataFolder“dir”)流(下载Physionet心电分割数据集(72 MB)…) websave(文件名,url);解压缩(文件名,downloadFolder);流(“完成。\ n”结束

解凍すると,一時ディレクトリにフォルダQT_Database-masterが作成されます。このフォルダには,テキストファルREADME.mdと次のファ@ @ルが含まれます。

  • QTData.mat

  • Modified_physionet_data.txt

  • License.txt

QTData.matには,PhysioNet心电分割デ,タが含まれています。ファereplicationルModified_physionet_data.txtは,デ,タ用のソ,ス属性と,生のecg記録ごとに適用される操作の説明を提供します。MATファルからPhysioNet心电分割デタを読み込みます。

负载(fullfile (dataFolder“QTData.mat”))

このデタを深層学習用に処理する方法を示す例にいては,深層学習を使用した波形セグメンテ,ションを参照してください。

序列到标签分類,波形セグメンテ,ション

歩行者,自動車,自転車運転者の合成後方散乱

深層学習を使用した歩行者と自転車運転者の分類の例で使用されている補助関数helperBackScatterSignalshelperDopplerSignaturesを使用して,歩行者,自動車,自転車運転者の合成後方散乱デ,タセットを生成します。

補助関数helperBackScatterSignalsは,指定された数の歩行者,自転車運転者,および自動車のレ,ダ,出力を生成します。各実現にいて,帰還信号の次元はN快行N慢列です。ここで,N快は“高速”サンプルの数,N慢は“低速”サンプルの数です。

補助関数helperDopplerSignaturesは,レーダー出力の短時間フーリエ変換(STFT)を計算して,マイクロドップラーシグネチャを生成します。マイクロドップラーシグネチャを取得するには,この補助関数を使用して,各信号にSTFTと前処理メソッドを適用します。

Oldpath = addpath(fullfile(matlabroot,“例子”“分阶段”“主要”));numPed = 1;%行人实现的数量numBic = 1;%自行车运动员实现的数量numCar = 1;%汽车实现的数量[xPedRec,xBicRec,xCarRec,Tsamp] = helpbackscattersignals (numPed,numBic,numCar);[加速,T,F] = helperDopplerSignatures(xPedRec,Tsamp);[SBic,~,~] = helperDopplerSignatures(xBicRec,Tsamp);[SCar,~,~] = helperDopplerSignatures(xCarRec,Tsamp);

このデタを深層学習用に処理する方法を示す例にいては,深層学習を使用した歩行者と自転車運転者の分類を参照してください。

パスを元に戻すには,関数路径を使用します。

路径(媒介);

从序列到标签分類

生成された波形

深層学習を使用したレ,ダ,波形の分類の例で使用されている補助関数helperGenerateRadarWaveformsを使用して,矩形波形,線形FM波形,位相符号化波形を生成します。

補助関数helperGenerateRadarWaveformsは,各変調タプにき100 MHzのサンプルレトで3000個の信号を生成します。矩形パルスには分阶段。RectangularWaveform,線形FMには分阶段。LinearFMWaveform,およびバ.カ.符号をも.位相符号化パルスには分阶段。PhaseCodedWaveformを使用します。

Oldpath = addpath(fullfile(matlabroot,“例子”“分阶段”“主要”));[wav, modType] = helpergenerateradarwaves forms;

このデタを深層学習用に処理する方法を示す例にいては,深層学習を使用したレ,ダ,波形の分類を参照してください。

パスを元に戻すには,関数路径を使用します。

路径(媒介);

从序列到标签分類

ビデオのデ,タセット

デタ 説明 タスク

HMDB(大規模人間動作デ,タベ,ス)

(典型例)

Hmbd51デ,タセットには,“飲む”,“走る”,“腕立て伏せ”など,51クラスの7000個のクリップから成る約2 GBのビデオデータが格納されています。

HMDB(大規模人間動作デ,タベ,ス)からhmdb51デタセットをダウンロドして解凍します。このデ,タセットは約2gbです。。

Rarファ电子邮箱ルを解凍した後,深層学習を使用したビデオの分類の例で使用されている補助関数hmdb51Filesを使用してビデオのファ@ @ル名とラベルを取得します。dataFolderをデ,タの場所に設定します。

Oldpath = addpath(fullfile(matlabroot,“例子”“nnet”“主要”));dataFolder = fullfile(tempdir,“hmdb51_org”);[files,labels] = hmdb51Files(dataFolder);

このデタを深層学習用に処理する方法を示す例にいては,深層学習を使用したビデオの分類を参照してください。

パスを元に戻すには,関数路径を使用します。

路径(媒介);

ビデオ分類

テキストのデ,タセット

デタ 説明 タスク

工場レポ,ト

工場レポ、トデ、タセットは、さまざまな属性(変数.描述内のプレ,ンテキストの説明,変数类别内のカテゴリカルラベルなど)をも約500件のレポトが含まれている表です。

ファereplicationル“factoryReports.csv”から工場レポ,トデ,タを読み取ります。描述列と类别列から,それぞれテキストデ,タとラベルを抽出します。

文件名=“factoryReports.csv”;数据= readtable(文件名,“TextType”“字符串”);textData = data.Description;labels = data.Category;

このデタを深層学習用に処理する方法を示す例にいては,深層学習を使用したテキストデ,タの分類を参照してください。

テキスト分類,トピックモデリング

シェ@ @クスピアのソネット

ファereplicationルsonnets.txtには,シェ▪▪クスピアのソネット全集が1▪▪のテキストファ▪▪ルとして格納されています。

ファereplicationル“sonnets.txt”からシェ▪▪クスピアのソネットのデ▪▪タを読み取ります。

文件名=“sonnets.txt”;textData = fileread(文件名);

ソネットは2の空白文字でンデントされ,2の改行文字で区切られています。取代を使用して电子邮箱ンデントを削除し,分裂を使用してテキストを個別のソネットに分割します。最初の3の要素のメ。

textData = replace(textData,”“"");textData = split(textData,[newline newline]);textData = textData(5:2:end);

このデタを深層学習用に処理する方法を示す例にいては,深層学習を使用したテキストの生成を参照してください。

トピックモデリング,テキスト生成

arXivメタデ,タ

arXiv APIはhttps://arxiv.orgに提出された科学分野の電子出版物のメタデ,タ(要旨や主題など)へのアクセスを提供します。詳細にいては,https://arxiv.org/help/apiを参照してください。

arXiv APIを使用して,数学論文から概要とカテゴリラベルのセットをaapl .ンポ.トします。

url =“https://export.arxiv.org/oai2?verb=ListRecords”+...“集=数学”+...“&metadataPrefix = arXiv”;选项= weboptions(“超时”, 160);代码= webread(url,options);

返されたXMLコドを解析してさらに多くのレコドをンポトする方法を示す例にいては,深層学習を使用した複数ラベルをもテキストの分類を参照してください。

テキスト分類,トピックモデリング

古登堡计划の書籍

古登堡计划から数多くの書籍をダウンロ,ドできます。たとえば,関数webreadを使用して,https://www.gutenberg.org/files/11/11-h/11-h.htmからル▪▪スキャロルの“不思議の国のアリス”のテキストをダウンロ▪▪ドします。

url =“https://www.gutenberg.org/files/11/11-h/11-h.htm”;代码= webread(url);

HTMLコ,ドには,< p >(段落)要素の中に関連テキストが含まれています。関数htmlTreeを使用してHTMLコ,ドを解析し,要素名“p”を持すべての要素を検索して,関連テキストを抽出します。

tree = htmlTree(code);选择器=“p”;subtrees = findElement(树,选择器);

関数extractHTMLTextを使用してHTMLサブリからテキストデタを抽出し,空の要素を削除します。

textData = extractHTMLText(subtrees);textData (textData = ="") = [];

このデタを深層学習用に処理する方法を示す例にいては,深層学習を使用した単語単位のテキスト生成を参照してください。

トピックモデリング,テキスト生成

週末のアップデ,ト

ファereplicationルweekendUpdates.xlsx#周末“にはと“#假期”にハッシュタグが含まれている,ソーシャルメディアのステータス更新の例が格納されています。このデタセットを使用するには文本分析工具箱™が必要です。

関数readtableを使用してファ@ @ルweekendUpdates.xlsxからテキストデ,タを取得し,変数TextDataからテキストデ,タを抽出します。

文件名=“weekendUpdates.xlsx”;TBL =可读(文件名,“TextType”“字符串”);textData = tbl.TextData;

このデタを処理する方法を示す例にいては,分析文本中的情感(文本分析工具箱)を参照してください。

センチメント分析

ロ,マ数字

CSVファCSVル“romanNumerals.csv”には,1 ~ 1000の進数が最初の列に格納され,それに対応するローマ数字が2番目の列に格納されています。

CSVファCSVル“romanNumerals.csv”から10進数とロ,マ数字のペアを読み込みます。

文件名= fullfile(“romanNumerals.csv”);options = detectImportOptions(文件名,...“TextType”“字符串”...“ReadVariableNames”、假);选项。VariableNames = [“源”“目标”];选项。VariableTypes = [“字符串”“字符串”];数据=可读(文件名,选项);

このデタを深層学習用に処理する方法を示す例にいては,アテンションを使用した序列对序列変換を参照してください。

序列对序列変換

財務レポ,ト

証券取引委員会(SEC)は,电子数据收集、分析和检索(埃德加)APIを介した財務レポートへのアクセスを許可しています。詳細にいては,https://www.sec.gov/edgar/searchedgar/accessing-edgar-data.htmを参照してください。

このデ,タをダウンロ,ドするには,生成领域特定的情感词汇(文本分析工具箱)の例にサポトファルとして添付されている関数financeReportsを使用します。この関数にアクセスするには,例をラ。

年= 2019年;QTR = 4;maxLength = 2e6;textData = financeReports(year,qtr,maxLength);

このデタを処理する方法を示す例にいては,生成领域特定的情感词汇(文本分析工具箱)を参照してください。

センチメント分析

オ,ディオデ,タセット

デタ 説明 タスク

音声コマンド

音声コマンドデ,タセット[18]は,12のクラス(是的没有など)のいずれかのラベル,および不明なコマンドやバックグラウンドノイズに対応するクラスのラベルが付けられた約65000個のオーディオファイルで構成されています。

https://storage.googleapis.com/download.tensorflow.org/data/speech_commands_v0.01.tar.gzから音声コマンドデ,タセットをダウンロ,ドして解凍します。このデタセットは約1.4 gbです。。

dataFolderをデ,タの場所に設定します。audioDatastoreを使用して,ファ。

dataFolder = tempdir;ads = audioDatastore(数据文件夹,...“IncludeSubfolders”,真的,...“FileExtensions”“wav”...“LabelSource”“foldernames”);

このデタを深層学習用に処理する方法を示す例にいては,深層学習を使用した音声コマンド認識を参照してください。

オ,ディオ分類,音声認識

Mozilla Common Voice

Mozilla常见声音データセットは,録音音声および対応するテキストファイルで構成されています。デ,タには,年齢,性別,アクセントなど,人口統計のメタデ,タも含まれています。

https://voice.mozilla.org/からMozilla公共语音デ,タセットをダウンロ,ドして解凍します。このデタセットはオプンなデタセットであるため,時間がたにれて大きくなる可能性があります。2019年10月現在,このデ.タセットは約28 gbです。。dataFolderをデ,タの場所に設定します。audioDatastoreを使用して,ファ。

dataFolder = tempdir;ads = audioDatastore(fullfile(数据文件夹,“剪辑”));

このデタを深層学習用に処理する方法を示す例にいては,格鲁ネットワ,クを使用した性別の分類を参照してください。

オ,ディオ分類,音声認識

免费语音数字数据集

免费使用数字数据集には,2019年1月29日現在,4人の話者が英語で発話した0 ~ 9の数字の録音が2000件含まれています。このバージョンでは,2人の話者はアメリカ英語を話すネイティブスピーカー,他の2人の話者はそれぞれベルギーフランス語なまりとドイツ語なまりの英語を話す非ネイティブスピーカーです。デ,タは8000 Hzでサンプリングされます。

https://github.com/Jakobovski/free-spoken-digit-datasetから免费口语数字数据集(FSDD)の録音音声をダウンロードします。

dataFolderをデ,タの場所に設定します。audioDatastoreを使用して,ファ。

dataFolder = fullfile(tempdir,“free-spoken-digit-dataset”“录音”);ads = audioDatastore(dataFolder);

このデタを深層学習用に処理する方法を示す例にいては,ウェ,ブレット散乱と深層学習を使用した数字音声認識を参照してください。

オ,ディオ分類,音声認識

柏林情感语言数据库

柏林情感语言数据库[19]には,10人の俳優によって話された535個の発話が含まれています。これらの発話では,怒り,退屈,嫌悪,不安/恐怖,幸福,悲しみ,中立のいずれかの感情が表されています。感情はテキストと無関係です。

ファル名は,話者id,発話されたテキスト,感情,およびバジョンを表すコドです。Webサイトには,コードを解釈するためのヒント,および話者に関する追加の情報(性別や年齢など)が記載されています。

http://emodb.bilderbar.info/index-1280.htmlから,柏林情感言语数据库をダウンロ,ドします。このデタセットは約40 MBです。。

dataFolderをデ,タの場所に設定します。audioDatastoreを使用して,ファ。

dataFolder = tempdir;ads = audioDatastore(fullfile(数据文件夹,“wav”));

このデタを深層学習用に処理する方法を示す例にいては,音声感情認識を参照してください。

オ,ディオ分類,音声認識

TUT声学场景2017

图坦卡蒙声学场景2017,开发数据集およびTUT声学场景2017,评估数据集から,TUT声学场景2017デ,タセット[20]をダウンロ,ドして解凍します。

このデタセットは15の音響シン(“バス”,"自動車"、“図書館”など)から取得した10秒間のオ,ディオセグメントで構成されています。

このデタを深層学習用に処理する方法を示す例にいては,後期融合を使用した音響シ,ン認識を参照してください。

音響シ,ン分類

参照

梅萨罗斯,安娜玛利亚,托尼·海托拉,还有图马斯·维尔塔宁。声场景分类:DCASE 2017挑战赛参赛作品概述国际声学信号增强研讨会论文集(2018):

411 - 415。

[1] Lake, Brenden M., Ruslan Salakhutdinov, Joshua B. Tenenbaum。“通过概率程序归纳的人类水平概念学习”科学350,不是。6266(2015年12月11日):1332-38。https://doi.org/10.1126/science.aab3050。

[3] Kat,郁金香,图片,https://www.flickr.com/photos/swimparallel/3455026124.创作共用许可证(CC BY)。

[4] Rob Bertholf,向日葵,图片,https://www.flickr.com/photos/robbertholf/20777358950.创作共用2.0通用许可。

[5] Parvin, Roses, image,https://www.flickr.com/photos/55948751@N00.创作共用2.0通用许可。

约翰·哈斯拉姆,蒲公英,图片,https://www.flickr.com/photos/foxypar4/645330051.创作共用2.0通用许可。

[7]克里哲夫斯基,亚历克斯。“从微小图像中学习多层特征。”硕士论文,多伦多大学,2009年。https://www.cs.toronto.edu/%7Ekriz/learning-features-2009-TR.pdf

[8] Brostow, Gabriel J., Julien Fauqueur和Roberto Cipolla。视频中的语义对象类:一个高清地面真相数据库。模式识别信30,没有。2(2009年1月):88-97。https://doi.org/10.1016/j.patrec.2008.04.005

Kemker, Ronald, Carl Salvaggio和Christopher Kanan。用于语义分割的高分辨率多光谱数据集[c], 2017年3月6日。https://arxiv.org/abs/1703.01918

Isensee, Fabian, Philipp Kickingereder, Wolfgang Wick, Martin Bendszus和Klaus H. Maier-Hein。“脑肿瘤分割和放射组学生存预测:对BRATS 2017挑战的贡献。”《脑损伤:胶质瘤、多发性硬化症、中风和创伤性脑损伤》,由Alessandro Crimi、Spyridon Bakas、Hugo Kuijf、Bjoern Menze和Mauricio Reyes编辑,10670:287-97。瑞士湛:施普林格国际出版社,2018年。https://doi.org/10.1007/978-3-319-75238-9_25

[11] Ehteshami Bejnordi, Babak, Mitko Veta, Paul Johannes van Diest, Bram van Ginneken, Nico Karssemeijer, Geert Litjens, Jeroen A. W. M. van der Laak等,“深度学习算法用于检测乳腺癌女性淋巴结转移的诊断评估。”JAMA 318,不是。22(2017年12月12日):2199。https://doi.org/10.1001/jama.2017.14585

[12]工藤,美一,富山俊,新保真。“使用穿过区域的多维曲线分类”模式识别信20,没有。11-13(1999年11月):1103-11。https://doi.org/10.1016/s0167 - 8655 (99) 00077 - x

[13]工藤,美一,富山俊,新保真。日语元音数据集。由UCI机器学习库分发。https://archive.ics.uci.edu/ml/datasets/Japanese+Vowels

Saxena, Abhinav, Kai Goebel。涡扇发动机退化仿真数据集NASA艾姆斯预测数据仓库https://ti.arc.nasa.gov/tech/dash/groups/pcoe/prognostic-data-repository/美国宇航局艾姆斯研究中心,莫菲特场,加利福尼亚州

Rieth, Cory A., Ben D. Amsel, Randy Tran和Maia B. Cook。附加田纳西伊士曼过程模拟数据异常检测评估。哈佛数据厌恶,版本1,2017。https://doi.org/10.7910/DVN/6C3JR1

Goldberger, Ary L., Luis A. N. Amaral, Leon Glass, Jeffery M. Hausdorff, Plamen Ch. Ivanov, Roger G. Mark, Joseph E. Mietus, George B. Moody,彭仲康和H. Eugene Stanley。“PhysioBank, PhysioToolkit,和PhysioNet:复杂生理信号新研究资源的组成部分。”《循环101》第23期,2000年,第e215-e220页。https://circ.ahajournals.org/content/101/23/e215.full

[17]拉古纳、巴勃罗、罗杰·g·马克、阿里·l·戈德伯格和乔治·b·穆迪。心电图QT和其他波形间隔测量算法评估数据库心脏病学24,1997,pp. 673-676。

狱长P。“语音命令:用于单词语音识别的公共数据集”,2017年。可以从http://download.tensorflow.org/data/speech_commands_v0.01.tar.gz.版权所有谷歌2017。语音命令数据集是在创作共用属性4.0许可下授权的,可在这里获得:https://creativecommons.org/licenses/by/4.0/legalcode

[19] Burkhardt, Felix, Astrid Paeschke, Melissa A. Rolfes, Walter F. Sendlmeier和Benjamin Weiss。"德语情感语言数据库"2005年国际语言会议论文集.里斯本,葡萄牙:国际语音交流协会,2005年。

Mesaros, Annamaria, Toni Heittola和Tuomas Virtanen。声场景分类:DCASE 2017挑战赛参赛作品概述2018年第16届国际声学信号增强研讨会(IWAENC),第411-415页。IEEE 2018。

参考

|

関連するトピック