主要内容

使用深度网络设计器创建简单的序列分类网络

这个示例展示了如何使用Deep network Designer创建一个简单的长短期记忆(LSTM)分类网络。

要训练一个深度神经网络来分类序列数据,可以使用LSTM网络。LSTM网络是一种循环神经网络(RNN),它学习序列数据的时间步长之间的长期依赖关系。

这个例子演示了如何:

  • 加载序列数据。

  • 搭建网络架构。

  • 指定培训选项。

  • 培训网络。

  • 预测新数据的标签,计算分类精度。

加载数据

加载日语元音数据集,如中所述[1][2].预测器是包含不同长度序列的单元数组,特征维数为12。这些标签是标签1、2、…、9的分类向量。

[XTrain, YTrain] = japaneseVowelsTrainData;[XValidation, YValidation] = japaneseVowelsTestData;

查看前几个训练序列的大小。序列是12行(每一行代表一个特性)和不同数量的列(每一列代表一个时间步)的矩阵。

XTrain (1:5)
ans =5×1单元阵列{12×20 double} {12×26 double} {12×22 double} {12×20 double} {12×21 double}

定义网络体系结构

开放的深度网络设计器。

deepNetworkDesigner

暂停上Sequence-to-Label并点击开放.这开启了一个适合于序列分类问题的预构建网络。

深层网络设计器显示预构建的网络。

您可以很容易地为日语元音数据集适应这个序列网络。

选择sequenceInputLayer和检查InputSize设置为12以匹配特征尺寸。

选择lstmLayer并设置NumHiddenUnits到100年。

选择fullyConnectedLayer和检查OutputSize设置为9,表示类的数量。

检查网络体系结构

单击,可以查看网络和各层的详细信息分析

出口网络体系结构

要将网络体系结构导出到工作区,请在设计师选项卡上,单击出口.Deep Network Designer将网络保存为变量layers_1

您还可以通过选择生成代码来构造网络体系结构出口>生成代码

列车网络的

指定训练选项并训练网络。

因为迷你批较小,序列较短,所以CPU更适合于训练。集“ExecutionEnvironment”“cpu”.要在GPU上训练,如果可用,设置“ExecutionEnvironment”“汽车”(默认值)。

miniBatchSize = 27个;选择= trainingOptions (“亚当”...“ExecutionEnvironment”“cpu”...“MaxEpochs”, 100,...“MiniBatchSize”miniBatchSize,...“ValidationData”{XValidation, YValidation},...“GradientThreshold”2,...“洗牌”“every-epoch”...“详细”假的,...“阴谋”“训练进步”);

培训网络。

网= trainNetwork (XTrain YTrain、layers_1选项);

您还可以使用Deep network Designer和数据存储对象训练这个网络。有关如何在Deep network Designer中训练序列到序列回归网络的示例,请参见利用深度网络设计器进行时间序列预测的训练网络

测试网络

对测试数据进行分类并计算分类精度。指定与培训相同的小批量。

XValidation YPred =分类(净,“MiniBatchSize”, miniBatchSize);acc = mean(YPred == YValidation)
acc = 0.9405

在接下来的步骤中,您可以尝试通过使用双向LSTM (BiLSTM)层或创建更深层次的网络来提高准确性。有关更多信息,请参见长短时记忆网络

有关如何使用卷积网络对序列数据进行分类的示例,请参见基于深度学习的语音命令识别

参考文献

工藤,明一,富山俊,和新博。"使用穿越区域进行多维曲线分类"模式识别字母20,不。11-13(1999年11月):1103-11。https://doi.org/10.1016/s0167 - 8655 (99) 00077 - x。

工藤,明一,富山俊,和新博。日语元音数据集。由UCI机器学习库发布。https://archive.ics.uci.edu/ml/datasets/Japanese+Vowels

另请参阅

相关的话题