主要内容

roialign

的非量化ROI池dlarray数据

描述

ROI对齐操作将矩形ROI池到固定大小的容器中,而不将网格点量化到最近的像素。该函数使用双线性插值来推断每个网格点的值。

给定大小为[HWCN),C是通道数和N是观测的数量,合并后的深度学习数据有大小[hwC总和),h而且w是指定的输出大小。向量是长度的吗N而且)为与。相关的roi数目th观察。

请注意

中执行ROI池layerGraph(深度学习工具箱)对象或(深度学习工具箱)数组,使用roiAlignLayer

此功能需要深度学习工具箱™。

例子

海底= roialign (dlX盒子outputSize沿着输入的空间维度执行池化操作X对于每个包围框盒子.的输出,Y,大小不一outputSize

海底= roialign (dlX盒子outputSize名称=值指定附加的名称-值参数。

例子

全部折叠

创建一个4-D格式dlarray对象,模拟两个RGB图像的批处理。

X = dlarray(rand(10,10,3,2),“SSCB”);

指定一个包围框的位置和批索引。

startXY = [2 2];endXY = [4 4];batchIdx = 1;rois = [startXY endXY batchIdx]';

执行ROI池,输出大小为3 × 3。

Y = roialign(X,rois,[3 3])
Y = 3(S) × 3(S) × 3(C) × 1(B)单元(:,:,1)= 0.7464 0.3069 0.1780 0.9212 0.8491 0.4677 0.7303 0.9057 0.3840 (:,:,2)= 0.3024 0.6428 0.6594 0.1542 0.0046 0.1228 0.6295 0.5182 0.3304 (:,:,3)= 0.4915 0.7590 0.5035 0.4574 0.4302 0.5453 0.2960 0.2666 0.5389

输入参数

全部折叠

深度学习数据池,指定为4-D格式dlarray(深度学习工具箱)对象,数据格式为“SSCB”。

边界框,指定为5 × -N数字矩阵,N是包围框的数量。每个包围框都被格式化为[x_starty_startx_endy_endbatchIdx),地点:

  • x_start而且y_start指定矩形左上角的(x,y)坐标。

  • x_end而且y_end指定矩形右下角的(x,y)坐标。

  • batchIdx指定与矩形对应的观察结果的索引。

默认情况下,盒子是否与输入的深度学习数据在同一坐标空间和尺度内dlX

池输出大小,指定为两个正整数的向量[w h],在那里h是高度和w是宽度。

名称-值参数

指定可选参数对为Name1 = Value1,…,以=家,在那里的名字参数名称和价值对应的值。名称-值参数必须出现在其他参数之后,但对的顺序无关紧要。

例子:dlY = roialign(dlX,boxes,outputSize,ROIScale=2)将输入roi按2倍的比例缩放

输入特征映射的比例尺与ROI坐标的比例尺之比。这个比率指定用于将输入roi缩放到输入特征映射大小的因子。

每个池存储箱中的样本数量,指定为“汽车”或者两个正整数组成的行向量。这两个元素分别是垂直和水平样本数。

如果不指定抽样比,则垂直抽样数为默认值(即:roiHeight/outputHeight.同样,水平采样的数量具有默认值(即:roiWidth/outputWidth

数据类型:|字符

输出参数

全部折叠

汇总深度学习数据,以4-D格式返回dlarray(深度学习工具箱)对象,数据格式为“SSCB”。

更多关于

全部折叠

ROI对齐

ROI对齐操作为输入中的每个矩形ROI返回固定大小的特征映射dlarray.该函数首先将ROI划分为固定大小的容器OutputSize没有量化格点。每个箱子在SamplingRatio的位置。每个采样点的值是用双线性插值推断出来的。采样值的平均值将作为每个池化bin的输出值返回。

扩展功能

版本历史

R2021b中引入