detectTextCRAFT
描述
例子
通过使用工艺模型检测图像中的文本
一个输入图像读入MATLAB工作区。
我= imread (“handicapSign.jpg”);
计算使用的文本检测结果detectTextCRAFT
函数。地区和亲和力阈值设置为默认值。的输出是一组边界框包含发现的文本区域。
bboxes = detectTextCRAFT(我);
画出输出图像通过使用边界框insertShape
函数。
Iout = insertShape(我“矩形”bboxes,线宽= 3);
检测结果显示文本。
图imshow (Iout)
在ROI检测文本使用工艺
一个输入图像读入MATLAB工作区。
visiondatadir = fullfile (toolboxdir (“愿景”),“visiondata”);我= imread (fullfile (visiondatadir,“imageSets”,“书”,“pairOfBooks.jpg”));
指定感兴趣区域(ROI)在输入图像。
投资回报率= (120、80250200);
检测文本在指定的ROI内使用detectTextCRAFT
函数。该地区和亲和力阈值设置为默认值。的输出是一组边界框包含发现的文本区域。
bboxes = detectTextCRAFT (roi);
画出ROI和输出边界框在输入图像。检测结果显示文本。
我= insertObjectAnnotation (,“矩形”投资回报率,“投资回报”颜色=“绿色”);Iout = insertShape(我“矩形”bboxes,线宽= 3);图imshow (Iout)
通过修改亲和力阈值检测字符
这个例子展示了如何检测每个字符在文本区域输入图像的使用工艺模型。你可以通过修改亲和力阈值来实现这一点。这个示例还演示了不同的亲和力阈值对检测结果的影响。
一个输入图像读入MATLAB工作区。
visiondatadir = fullfile (toolboxdir (“愿景”),“visiondata”);我= imread (fullfile (visiondatadir,“封套”,“book27.jpg”));
考虑指定亲和力阈值检测图像中的文本区域。
阈值= (1 0.1 0.01 0.001 0.0004);
Preallocate四维数组Iout
存储输出图像的检测结果。
Iout = 0(大小(我,1),大小(我,2),(我,3)大小,长度(阈值));
计算每个亲和力阈值指定的输出输入。的输出是一组边界框包含发现的文本区域。画出输出图像通过使用边界框insertShape
函数。区域阈值设置为默认值,0.4。
为问= 1:长度(阈值)bboxes = detectTextCRAFT(我LinkThreshold =阈值(问));Iout (:,:,: cnt) = insertShape(我“矩形”bboxes,线宽= 3);结束
显示的文本检测结果不同的亲和力阈值。你可以注意亲和力阈值降低,角色亲和力较低分数视为连接组件和分组为一个单一的实例。良好的定位和检测结果,亲和力阈值必须大于零。
图蒙太奇(uint8 (Iout),大小=[1 5],写成BackgroundColor =“白色”);标题([“LinkThreshold = 'num2str(阈值(1))“| LinkThreshold = 'num2str(阈值(2))“| LinkThreshold = 'num2str(阈值(3))…“| LinkThreshold = 'num2str(阈值(4))“| LinkThreshold = 'num2str(阈值(5)));
输入参数
我
- - - - - -输入图像
二维灰度图像|二维彩色图像
输入图像,指定为一个二维灰度图像或二维彩色图像。
数据类型:单
|双
|int16
|uint8
|uint16
|逻辑
roi
- - - - - -搜索矩形的
研制出向量
搜索一个矩形的一个图像,指定为研制出向量的形式xy宽度高度]。向量指定左上角和一个矩形区域像素的大小。该地区必须完全包含在图像。
当你指定这个值,detectTextCRAFT
功能检测文本只存在在这个ROI。
数据类型:单
|双
|int8
|int16
|int32
|int64
|uint8
|uint16
|uint32
|uint64
名称-值参数
指定可选的双参数作为Name1 = Value1,…,以=家
,在那里的名字
参数名称和吗价值
相应的价值。名称-值参数必须出现在其他参数,但对的顺序无关紧要。
例子:bboxes = detectTextCRAFT(我最大尺寸= (10,10))
指定的最大大小检测输入图像中的文本区域
CharacterThreshold
- - - - - -区域阈值为字符
0.4(默认)|积极的标量
本地化区域阈值中的每个字符图像,指定为一个积极的标量在[0,1]。增加检测的数量,降低阈值。然而,这也会导致假阳性。减少假阳性的数量,增加该地区的阈值。
数据类型:单
|双
LinkThreshold
- - - - - -链接阈值
0.4(默认)|积极的标量
链接阈值将相邻字符分组为一个词,指定为一个积极的标量范围[0,1]。你可以增加角色的数量水平检测阈值通过增加链接。检测图像中每个字符,将这个值设置为1。良好的定位和检测结果,链接阈值必须大于零。
数据类型:单
|双
MinSize
- - - - - -最小可探测的文本区域的大小
(6,6)(默认)|双元素向量
规模最小的图像中检测到文本区域,指定为一个双元素向量的形式(高度宽度]。
数据类型:单
|双
|int8
|int16
|int32
|int64
|uint8
|uint16
|uint32
|uint64
最大尺寸
- - - - - -最大可探测的文本区域的大小
输入图像的大小(默认)|双元素向量
规模最大的图像中检测到文本区域,指定为一个双元素向量的形式(高度宽度]。默认情况下,这个值设置为输入图像的高度和宽度。
数据类型:单
|双
|int8
|int16
|int32
|int64
|uint8
|uint16
|uint32
|uint64
ExecutionEnvironment
- - - - - -硬件资源
“汽车”
(默认)|“cpu”
|“图形”
硬件资源来处理图像与工艺模型,指定为“汽车”
,“图形”
,或“cpu”
。
ExecutionEnvironment | 描述 |
---|---|
“汽车” |
使用GPU如果可用。否则,使用CPU。使用CUDA GPU需要并行计算工具箱™和®使英伟达®GPU。关于支持计算能力的信息,看到金宝appGPU计算的需求(并行计算工具箱)。 |
“图形” |
使用GPU。如果没有一个合适的GPU,函数返回一个错误消息。 |
“cpu” |
使用CPU。 |
数据类型:字符
|字符串
加速度
- - - - - -性能优化
“汽车”
(默认)|“墨西哥人”
|“没有”
性能优化,指定为“汽车”
,“墨西哥人”
,或“没有”
。
加速度 | 描述 |
---|---|
“汽车” |
自动应用一些优化适合输入网络和硬件资源。 |
“墨西哥人” |
编译和执行一个墨西哥人的功能。此选项仅在使用GPU可用。你还必须有一个C / c++编译器安装。设置说明,请参阅墨西哥人设置(GPU编码器)。 |
“没有” |
禁用所有加速度。 |
默认的选项是“汽车”
。如果你使用“汽车”
选项,MATLAB®没有产生过墨西哥人的功能。
使用“加速”
选项“汽车”
和“墨西哥人”
可以提供性能优势,但在初始运行时间增加为代价的。后续调用与兼容的参数是更快。使用性能优化计划多次调用该函数时使用新的输入数据。
的“墨西哥人”
选项生成并执行一个墨西哥人函数基于网络和参数在函数调用中使用。你可以有几个墨西哥人函数与一个网络。结算网络变量也清除任何墨西哥人功能与网络有关。
的“墨西哥人”
选项仅当你使用GPU。使用GPU并行计算需要工具箱和CUDA NVIDIA GPU启用。关于支持计算能力的信息,看到金宝appGPU计算的需求(并行计算工具箱)。如果并行计算工具箱或合适的GPU不可用,那么函数将返回一个错误。
输出参数
bboxes
——边界盒检测到文本区域
米4矩阵
边界框指定检测到文本区域,作为一个返回米4矩阵。米是检测到文本区域的数量。矩阵中的每一行是一个向量的形式(xy宽度高度]。向量指定左上角和检测区域像素的大小。
版本历史
介绍了R2022a
MATLAB명령
다음MATLAB명령에해당하는링크를클릭했습니다。
명령을실행하려면MATLAB명령창에입력하십시오。웹브라우저는MATLAB명령을지원하지않습니다。
你也可以从下面的列表中选择一个网站:
表现最好的网站怎么走吗
选择中国网站(中文或英文)最佳站点的性能。其他MathWorks国家网站不优化的访问你的位置。