主要内容

预处理

预处理训练和测试图像

    描述

    例子

    outputData=进行预处理(探测器培训数据对训练数据进行预处理培训数据在使用它训练YOLO v3目标检测器之前。训练图像和相应的边界框存储在培训数据这个预处理Function执行以下操作:

    • 将训练图像的强度值重新调整到范围[0,1]。

    • 将训练图像调整为最接近的网络输入大小之一,并更新边界框坐标值以进行精确训练。该函数保留训练数据的原始纵横比。

    例子

    outputImg=进行预处理(探测器img对测试图像进行预处理img使用YOLO v3对象检测器进行对象检测。的预处理Function执行以下操作:

    • 将测试图像的强度值重新调整到范围[0,1]。

    • 调整测试图像的大小到最接近的网络输入大小之一,并保留每个测试图像的原始宽高比。

    ___scaleInfo) =预处理(___返回关于用于图像调整大小的比例因子的信息,以及来自前面语法的参数的任何组合。

    请注意

    此函数需要计算机视觉工具箱™模型的YOLO v3对象检测.你可以安装YOLO v3目标检测的计算机视觉工具箱模型从附加的探险家。有关安装附加组件的详细信息,请参见获取和管理附加组件.要运行此函数,您将需要深度学习工具箱™。

    例子

    全部折叠

    加载预训练的YOLO v3对象检测器。

    探测器= yolov3ObjectDetector (“tiny-yolov3-coco”);

    将训练数据集加载到工作空间中。训练数据是一个单元格数组,其中包含图像、边框值和类标签。

    负载(“trainingData.mat”“培训数据”);

    将训练图像调整为最近的网络输入大小,并使用预处理函数。

    输出数据=预处理(检测器、训练数据);

    显示输出图像和用于调整图像大小的比例信息。

    outputImg=outputData{1,1};图imshow(输出)

    显示输入和预处理值。

    bboxIn = cell2table (trainingData,“VariableNames”,{“图片”“边界框”“标签”})
    bboxIn=3×3表(UUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUU
    bboxOut=cell2table(输出数据,“VariableNames”,{“图片”“边界框”“标签”})
    bboxOut =3×3表图像边界框标签  __________________ ________________________ ___________ { 416×416×229 232 36 29单}{‘汽车’}{416×416×3单}182 222 64 46{‘汽车’}{416×416×3单}112 215 47 35{‘汽车’}

    加载预训练的YOLO v3对象检测器。

    探测器= yolov3ObjectDetector (“tiny-yolov3-coco”);

    读取测试图像。

    我= imread (“高速公路,巴布亚新几内亚”);

    将测试图像的大小调整为网络输入的大小,并使用预处理函数。

    [outputImg, scaleInfo] =预处理(探测器,我);

    显示输出图像和用于调整图像大小的比例信息。

    图imshow (outputImg)

    disp (scaleInfo)
    预编辑图像大小:[416 416]ScaleX:0.7692 ScaleY:0.5769

    输入参数

    全部折叠

    YOLO v3对象检测器,指定为yolov3ObjectDetector对象

    YOLO v3对象检测器的训练数据,指定为N-by-3单元格数组,包含图像、边框和类标签。每一行的格式为[图片边界框标签].N为网络中输出层的数目。边界框必须存储为K- × 4矩阵的形式[xy宽度高度].K是对象类的数量。

    测试图像,指定为大小的数字数组-借-N-借-C-借-N-借-C-借-T是行数,N是列数,和C是颜色通道的数量。的值C1对于灰度图像和3.RGB彩色图像。T数组中测试图像的数量。

    数据类型:||int8|int16|int32|int64|uint8|uint16|uint32|uint64

    输出参数

    全部折叠

    预处理的训练数据,返回为N3单元阵列。

    数据类型:单间牢房

    预处理的测试图像,作为大小的数字数组返回P-借--借-CP-借--借-C-借-TP是预处理图像中的行数和列数。

    数据类型:

    有关调整输入图像大小的比例因子的信息,作为带有字段的结构返回预编辑图像大小ScaleX写入ScaleY

    • 预编辑图像大小-大小的输出调整大小的图像。

    • ScaleX-用于调整图像中图像大小的比例因子X-方向(沿行)。

    • 写入ScaleY-用于调整图像中图像大小的比例因子Y-方向(沿列)。

    数据类型:结构体

    介绍了R2021a