主要内容

向前

计算视频分类器输出进行训练

自从R2021b

描述

例子

dLYVideo= (分类器,dlXVideo)计算分类器输出的视频培训。您可以使用此函数dlfeval(深度学习工具箱)自动计算梯度更新可学的视频分类器的参数。分类器被指定为一个r2plus1dVideoClassifierslowFastVideoClassifier分类器对象。

(dLYVideo,stateVideo]= (分类器,dlXVideo)还返回视频网络状态更新。输出,stateVideo之间,包含维护的信息分类器训练迭代。例如,批规范化操作的状态。

(dLYVideo,dlYFlow]= (分类器,dlXVideo,dlXFlow)还返回光流分类器的输出训练。当你设置使用该语法OpticalFlowMethod分类器对象的属性“Farneback”

(dLYVideo,dlYFlow,stateVideo,stateFlow]= (分类器,dlXVideo,dlXFlow)还返回更新的视频网络和光学流网络状态。

例子

全部折叠

这个例子展示了如何计算视频分类器输出进行训练。了解更多关于如何训练视频分类器网络数据集,明白了手势识别使用视频和深度学习

加载视频分类器pretrained动力学- 400数据集。

科幻小说= slowFastVideoClassifier;

指定视频文件名称。

videoFilename =“washingHands.avi”;

创建一个VideoReader阅读视频帧。

读者= VideoReader (videoFilename);

阅读所需数量的视频帧对应的视频分类器网络视频文件的开始。定义所需的帧数的四元素的值InputSize的视频分类器。

sequenceLength = sf.InputSize (4);sequenceRange = [1, sequenceLength];videoFrames =阅读(读者,sequenceRange);

调整视频帧进行训练。所需的高度和宽度的前两个元素定义InputSize的视频分类器。

heightWidth = sf.InputSize (1:2);大小= imresize (videoFrames heightWidth);

转换的输入类型

大小=单(大小);

重新调节输入0和1之间。

minValue = sf.InputNormalizationStatistics.Min;maxValue = sf.InputNormalizationStatistics.Max;minValue =重塑(minValue, 1, 1, 3);maxValue =重塑(maxValue, 1, 1, 3);大小=重新调节(大小,0,1,InputMin = minValue InputMax = maxValue);

正常使用平均值和标准偏差的视频数据。

meanValue = sf.InputNormalizationStatistics.Mean;stdValue = sf.InputNormalizationStatistics.StandardDeviation;meanValue =重塑(meanValue, 1, 1, 3);stdValue =重塑(stdValue, 1, 1, 3);大小=大小- meanValue;大小= resized. / stdValue;

转换的输入dlarray对象。

dlVideo = dlarray(大小,“SSCTB”);trainingActivations =前进(科幻,dlVideo);

找到相对应的类标签的最大得分。

[得分,idx] = max (trainingActivations);标签= sf.Classes (idx)
标签=分类洗手
分数
分数= 1 (S)×1 (S)×1 (S)×1 (C)×1 (B)单一dlarray 0.0026

显示类标签。

帧= videoFrames(:,:,:,结束);= insertText帧(帧,(2,2)字符串(标签),字形大小= 24);imshow(框架)

输入参数

全部折叠

分类器对象,指定为一个r2plus1dVideoClassifierslowFastVideoClassifier对象。

视频输入,指定为一个H——- - - - - -W——- - - - - -C——- - - - - -T——- - - - - -BSSCTB格式化dlarray(深度学习工具箱)对象对应的视频输入分类器。

  • H——高度。

  • W——宽度。

  • C——数量的渠道。通道的数量必须等于的渠道价值InputSize分类器对象的属性。

  • T——的帧数。帧的帧数必须等于价值InputSize分类器对象的属性。

  • B——批量大小。

视频和光学流输入,指定为一个H——- - - - - -W——- - - - - -C——- - - - - -T——- - - - - -BSSCTB格式化dlarray(深度学习工具箱)对象对应的视频和光学流分类器的输入。

  • H——高度。

  • W——宽度。

  • C——数量的渠道。通道的数量必须等于的渠道价值InputSize分类器对象的属性。

  • T——的帧数。帧的帧数必须等于价值InputSize分类器对象的属性。

  • B——批量大小。

输出参数

全部折叠

视频网络的激活,返回一个格式化的dlarray(深度学习工具箱)对象。

视频网络状态更新,返回表有三列:

  • ——层名称指定为一个字符串标量。

  • 参数参数名称,指定为一个字符串标量。

  • 价值——指定为一个参数值dlarray对象。

网络状态包含记得迭代之间的网络信息。例如,LSTM和批处理的状态正常化层。

在培训或推理,可以更新网络状态使用的输出向前预测功能。

激活光流的网络,作为一个格式化的返回dlarray(深度学习工具箱)对象。

光学流网络状态更新,返回一个表有三列:

  • ——层名称指定为一个字符串标量。

  • 参数参数名称,指定为一个字符串标量。

  • 价值——指定为一个参数值dlarray对象。

网络状态包含记得迭代之间的网络信息。例如,LSTM和批量标准化层的状态。

在培训或推理,可以更新网络状态使用的输出向前预测功能。

版本历史

介绍了R2021b