主要内容

视频分类

使用深度学习进行视频分类和活动识别

使用深度学习将来自可视数据源(如视频流)的图像序列中包含的活动或动作分类为一组类别。基于视觉的活动识别包括使用一组视频帧来预测一系列图像中的动作,例如走路、游泳或坐着。视频活动识别在人机交互、异常检测、监控等方面有着广泛的应用。要了解更多信息,请参见开始使用深度学习进行视频分类

应用程序

贴标签机视频 用于计算机视觉应用的标签视频
地面真相标签 标记自动驾驶应用的地面真实数据

功能

全部展开

groundTruth 地面真值标签数据
writeVideoScenes 将视频序列写入视频文件
sceneTimeRanges 现场标签与地面真实数据的时间范围
VideoReader 创建对象来读取视频文件
fileDatastore 带有自定义文件阅读器的数据存储
变换 变换数据存储
结合 组合来自多个数据存储的数据
folders2labels 从文件夹名中获取标签列表
splitlabels 找到索引,按照指定的比例拆分标签
inflated3dVideoClassifier I3D视频分类器。需要计算机视觉工具箱膨胀三维视频分类模型
slowFastVideoClassifier 慢速视频分类器。需要计算机视觉工具箱视频慢速分类模型
r2plus1dVideoClassifier R(2+1)D视频分类器。需要计算机视觉工具箱R(2+1)D视频分类模型
预测 计算视频分类器预测
向前 计算用于训练的视频分类器输出
imwarp 应用几何变换图像
imcrop 作物图像
imresize 调整图像
randomAffine2d 创建随机2-D仿射变换
centerCropWindow2d 创建矩形中心裁剪窗口
randomCropWindow2d (不推荐)创建随机矩形裁剪窗口
classifyVideoFile 分类视频文件
classifySequence 视频序列分类
updateSequence 更新视频序列分类
resetSequence 重置视频流视频分类的视频序列属性
愿景。放像机 播放视频或显示图像
愿景。DeployableVideoPlayer 显示视频
insertText 在图像或视频中插入文本

主题