文本检测和识别

检测和识别文本使用图像特征检测和描述,深度学习和OCR

检测和识别文本图像是一项常见的任务在计算机视觉的应用程序执行。例如,您可以捕获视频的道路场景移动车辆,在捕获的场景识别标志,提醒司机的迹象。工具箱提供了函数来检测和识别的多语言文本。

文字识别的第一步是一个图像中的文本区域检测和段。检测文本区域,使用本地图像特征探测器和描述符,或pretrained深学习模型训练检测文本在复杂图像场景。工具箱中的示例演示如何使用blob分析,最大限度地稳定极值区域特征检测器(女士),和文本的字符区域意识检测(工艺)深学习模型的文本检测。

Blob分析如果测试图像的关键工作前景图像与文本区域。方法使用地区统计数据有效地定位和提取文本图像中的前景。使用像binarize图像阈值图像分割方法。
女士特征检测器工作如果图像中的文本区域的几何特征是提前知道。同时,图像中的文本区域必须与均匀强度高对比度区域或颜色值。特征检测器利用几何约束过滤掉非文本区域和检测文本区域在图像均匀和复杂的背景。
工艺模型是一个健壮的方法检测文本区域图像无论图像背景等因素,对比,和强度值。使用工艺模型在分割图像中的文本区域是很困难的。该模型比其他文本检测方法需要更多的计算资源。

您可以执行文本分割预处理或后处理步骤改善文本检测的准确性。段文本从一个图像区域,利用图像分割技术,如图像的阈值和集群。关于MATLAB的信息^®函数图像分割,明白了图像分割。或者,您可以使用颜色阈值和图像裂殖体应用程序交互部分所需的文本图像中区域。

下一步是识别文本的检测或分割区域使用基于机器学习(ML)的分类或光学字符识别(OCR)方法。的光学字符识别函数使用OCR引擎的OCR语言数据支持文件页面,金宝app超正方体开源OCR引擎。支持文件金宝app包含pretrained语言数据文件在多种语言识别字符。你可以下载额外的语言文件使用vision金宝appSupportPackages函数或附加Explorer。下载插件的更多信息,请参阅获取和管理插件。程序如何安装和使用OCR的语言数据支持文件金宝app超正方体开源OCR引擎,请参阅安装OCR语言数据文件。

应用程序

OCR教练

火车一个光学字符识别模型识别一组特定的字符

功能

全部展开

特征检测和描述

`vision.BlobAnalysis`	连接区域的属性
`detectMSERFeatures`	检测女士特性和回报`MSERRegions`对象
`detectTextCRAFT`	检测图像中的文本通过工艺深度学习模型
`extractHOGFeatures`	提取的梯度的柱状图(猪)特性

识别

`光学字符识别`	识别文本使用光学字符识别
`ocrText`	对象存储OCR的结果
`vision金宝appSupportPackages`	开始安装程序下载、安装或卸载计算机视觉的工具箱数据