主要内容

roialign

经典的ROI池dlarray数据

描述

ROI对齐操作池一个矩形ROI为固定大小的箱子没有量化到最近的像素网格点。这个函数使用双线性插值来推断在每个网格点的值。

给定的输入数据的大小(HWCN),C的渠道和数量吗N是观测的数量,池深学习数据大小(hwC总和(),hw指定的输出大小。是一个向量的长度N()相关roi的数量th观察。

请注意

执行ROI池内layerGraph(深度学习工具箱)对象或(深度学习工具箱)数组,使用roiAlignLayer

这个函数需要深度学习工具箱™。

例子

海底= roialign (dlX,盒子,outputSize)执行一个池操作的过程输入的空间维度X对于每一个边界框盒子。的输出,Y的大小outputSize

海底= roialign (dlX,盒子,outputSize,名称=值)指定其他名称参数。

例子

全部折叠

创建一个4 - d格式dlarray对象,模拟一批两个RGB图像。

X = dlarray(兰德(10、10、3、2),“SSCB”);

指定一个边界框的位置和批量索引。

startXY = (2 - 2);endXY = 4 [4];batchIdx = 1;roi = [startXY endXY batchIdx]”;

执行ROI池3 x3的输出尺寸。

roi, Y = roialign (X 3 [3])
Y = x (S) 3 (S) 3 (C) x 1 (B)单dlarray (:,: 1) = 0.7464 0.3069 0.1780 0.9212 0.8491 0.4677 0.7303 0.9057 0.3840 (:,: 2) = 0.3024 0.6428 0.6594 0.1542 0.0046 0.1228 0.6295 0.5182 0.3304 (:,:, 3) = 0.4915 0.7590 0.5035 0.4574 0.4302 0.5453 0.2960 0.2666 0.5389

输入参数

全部折叠

深度学习的数据池,指定为一个4 d格式化dlarray(深度学习工具箱)对象的数据格式“SSCB”。

边界框,指定为5 -N数字矩阵,N边界框的数量。每一个边界框是格式化为一个列向量的形式x_start;y_start;x_end;y_end;batchIdx),地点:

  • x_starty_start指定的(x, y)坐标矩形的左上角。

  • x_endy_end指定的(x, y)坐标矩形的右下角。

  • batchIdx指定的索引对应于矩形的观察。

默认情况下,盒子在同一个坐标空间和规模作为输入深度学习数据dlX

池输出大小,指定为一个向量的两个正整数[w h],在那里h是身高和w是宽度。

名称-值参数

指定可选的双参数作为Name1 = Value1,…,以=家,在那里的名字参数名称和吗价值相应的价值。名称-值参数必须出现在其他参数,但对的顺序无关紧要。

例子:海底= roialign (dlX框、outputSize ROIScale = 2)尺度输入roi的2倍

的规模比输入特性映射到ROI的坐标。这个比例指定用于规模的因素输入roi的输入特性图的大小。

每个池本样本数量,指定为“汽车”或两个正整数的行向量。这两种元素数量的垂直和水平样本,分别。

如果你不指定采样率,然后垂直样品的数量默认值(即:roiHeight/outputHeight)。同样,水平样本的数量默认值(即:roiWidth/outputWidth)

数据类型:|字符

输出参数

全部折叠

池深度学习数据,作为4 d格式返回dlarray(深度学习工具箱)对象的数据格式“SSCB”。

更多关于

全部折叠

ROI对齐

一个ROI对齐操作返回固定大小的特征图中的每个矩形ROI输入dlarray。函数首先分区一个ROI的固定大小的箱子尺寸OutputSize没有量化网格点。每本进一步取样SamplingRatio的位置。每个采样点的值是推断使用双线性插值。采样值的平均值作为输出返回值每个池的垃圾箱。

扩展功能

版本历史

介绍了R2021b