主要内容

工具箱中的图像类型

图像处理工具箱™软件定义了几种基本的图像类型,总结在表格中。这些图像类型决定了MATLAB的处理方式®将数组元素解释为像素强度值。

假设图像处理工具箱中的所有图像都具有非稀疏值。除非另有说明,否则数字和逻辑映像应该是实值。

图像类型

解释

二进制图像

图像数据以格式存储——- - - - - -n逻辑矩阵,其中值0和1分别被解释为黑色和白色。一些工具箱函数也可以解释——- - - - - -n作为二值图像的数值矩阵,其中0值为黑色,所有非零值为白色。

索引图像

图像数据以格式存储——- - - - - -n数值矩阵,其元素是颜色映射的直接索引。颜色映射的每一行都指定了一种颜色的红、绿、蓝组件。

  • 数组,整数值范围为[1,p].

  • 逻辑uint8,或uint16数组,值的范围从[0,p1]。

颜色映射是c数据类型为-by-3的数组取值范围为[0,1]。

灰度图像

(也被称为强度图像)

图像数据以格式存储——- - - - - -n其元素指定强度值的数值矩阵。最小值表示黑色,最大值表示白色。

  • 数组,取值范围为[0,1]。

  • uint8数组,取值范围为[0,255]。

  • uint16,取值范围为[0,65535]。

  • int16,取值范围为[-32768,32767]。

真彩图像

(通常指RGB图像)

图像数据以格式存储——- - - - - -n- x3数值数组,其元素指定三个颜色通道之一的强度值。对于RGB图像,这三个通道表示图像的红、绿、蓝信号。

  • 数组中,RGB值的范围为[0,1]。

  • uint8数组中,RGB值的范围为[0,255]。

  • uint16, RGB取值范围为[0,65535]。

还有其他的模型,称为色彩空间,用三个色彩通道来描述颜色。对于这些色彩空间,每种数据类型的范围可能不同于RGB色彩空间中图像所允许的范围。例如,L*a*b*色彩空间中的像素值的数据类型可以是负的,也可以大于1。有关更多信息,请参见理解色彩空间和色彩空间转换

高动态范围(HDR)图像 HDR图像存储为——- - - - - -n数字矩阵或——- - - - - -n- × 3数值数组,分别类似于灰度或RGB图像。HDR图像具有数据类型但数据值不限于[0,1]范围,可以包含值。有关更多信息,请参见工作与高动态范围的图像
多光谱和高光谱图像

图像数据以格式存储——- - - - - -n——- - - - - -c数值数组,其中c是颜色通道的数目。

标签的图片

图像数据以格式存储——- - - - - -n非负整数的分类矩阵或数值矩阵。

二进制图像

在二值图像中,每个像素只有两个离散值:1或0中的一个。工具箱中的大多数函数将值为1的像素解释为属于感兴趣的区域,将值为0的像素解释为背景。二值图像经常与其他图像类型一起使用,以指示要处理图像的哪一部分。

该图显示了一个带有一些像素值的特写视图的二值图像。

黑色像素为假(0),白色像素为真(1)的二值图像

索引图像

索引图像由图像矩阵和颜色图组成。

颜色映射是一种c数据类型为- × 3的矩阵取值范围为[0,1]。颜色映射的每一行都指定了一种颜色的红、绿、蓝组件。

图像矩阵中的像素值是颜色图的直接索引。因此,索引图像中每个像素的颜色是通过将图像矩阵中的像素值映射到颜色映射中相应的颜色来确定的。映射取决于图像矩阵的数据类型:

  • 如果图像矩阵是数据类型,颜色图通常包含范围为[1,p),p是颜色映射的长度。值1指向颜色映射中的第一行,值2指向第二行,依此类推。

  • 如果图像矩阵是数据类型逻辑uint8uint16,颜色图通常包含范围为[0,p1]。值0指向颜色映射中的第一行,值1指向第二行,依此类推。

颜色图通常与索引图像一起存储,并在使用时自动加载该图像imread函数。将图像和colormap作为单独的变量读入工作空间后,必须跟踪图像和colormap之间的关联。但是,您并不局限于使用默认的颜色映射—您可以使用您选择的任何颜色映射。

该图分别说明了索引图像、图像矩阵和颜色图。图像矩阵为数据类型,所以值7指向颜色映射的第七行。

彩色索引图像,并附有打印像素和色图值的选择

灰度图像

灰度图像是一个数据矩阵,其值表示一个图像像素的强度。虽然灰度图像很少用颜色图保存,但MATLAB使用颜色图来显示它们。

您可以直接从相机获得灰度图像,该相机为每个像素获取单个信号。您还可以将真彩色或多光谱图像转换为灰度,以强调图像的某个特定方面。例如,您可以采用RGB图像的红、绿、蓝通道的线性组合,这样得到的灰度图像表示每个像素的亮度、饱和度或色调。您可以通过将通道拆分为单独的灰度图像来独立处理真彩色或多光谱图像的每个通道。

该图描绘了数据类型的灰度图像其像素值范围为[0,1]。

灰度图像附有选定的打印像素值

真彩图像

真彩色图像是一种图像,其中每个像素都有由三个值指定的颜色。图形文件格式将真彩色图像存储为24位图像,其中三个颜色通道每个为8位。这样可以产生1600万种颜色。现实生活中的图像可以精确地复制,这导致了通常使用的术语“真彩色图像”。

RGB图像是最常见的真彩色图像类型。在RGB图像中,三个颜色通道是红、绿和蓝。有关RGB颜色通道的详细信息,请参见显示分离的颜色通道的RGB图像

还有其他的模型,称为色彩空间,用三种不同的色彩通道来描述颜色。对于这些色彩空间,每种数据类型的范围可能不同于RGB色彩空间中图像所允许的范围。例如,L*a*b*色彩空间中的像素值的数据类型可以是负的,也可以大于1。有关更多信息,请参见理解色彩空间和色彩空间转换

真彩色图像不使用颜色映射。每个像素的颜色由存储在像素位置的每个颜色通道中的强度组合决定。

该图描述了浮点RGB图像的红、绿、蓝通道。观察像素值在[0,1]范围内。

RGB图像附带一个选择的打印像素值为三个颜色通道

要确定(行、列)坐标(2,3)处像素的颜色,您需要查看存储在向量(2,3,:)中的RGB三元组。假设(2,3,1)包含该值0.5176,(2,3,2)包含0.1608,和(2,3,3)包含0.0627.(2,3)处像素的颜色为

0.5176 0.1608 0.0627

HDR图像

动态范围是指亮度等级的范围。真实场景的动态范围可能相当高。高动态范围(HDR)图像试图捕捉真实世界场景(称为场景参考)的整个色调范围,使用32位浮点值来存储每个颜色通道。

该图描绘了原始像素值在[0,3.2813]范围内的色调映射HDR图像的红、绿、蓝通道。色调映射是将HDR图像的动态范围降低到计算机显示器或屏幕所期望的范围的过程。

HDR图像附带一个选择的打印像素值为三个颜色通道

多光谱和高光谱图像

多光谱图像是一种存储三个以上通道的彩色图像。例如,一张多光谱图像可以存储3个RGB颜色通道和3个红外通道,总共6个通道。多光谱图像中的通道数通常很少。相比之下,高光谱图像可以存储数十甚至数百个通道。

该图描绘了一幅具有6个通道的多光谱图像,其中包括红、绿、蓝通道(描绘为单个RGB图像)和3个红外通道。

多光谱图像分离成四个独立的图像,显示三个红外通道和RGB通道

标签的图片

标签图像是一种图像,其中每个像素指定感兴趣的类、对象或区域(ROI)。您可以使用分割技术从场景的图像派生标签图像。

  • 数字标签图像列举了场景中的对象或roi。标签是非负整数。背景通常具有值0.标记为1的像素构成一个对象;标记为2的像素构成第二个对象;等等......

  • 一个分类标签图像指定图像中每个像素的类别。背景通常被赋值<定义>

该图描述了一个包含三个类别的标签图像:花瓣、叶子和污垢。

标签图像伴随着打印的分类像素值的选择

相关的话题