Main Content

このページの翻訳は最新ではありません。ここをクリックして、英語の最新版を参照してください。

グラウンド トゥルース データにラベルを付けるためのアプリの選択

Computer Vision Toolbox™、Automated Driving Toolbox™、Lidar Toolbox™、Audio Toolbox™、および Signal Processing Toolbox™ アプリを使用して、グラウンド トゥルース データへのラベル付けができます。このラベル付けされたデータを使用して、イメージ分類器、オブジェクト検出器、セマンティック セグメンテーション ネットワーク、インスタンス セグメンテーション ネットワーク、および深層学習アプリケーションなどのアルゴリズムの検証や学習ができます。ラベル付けアプリの選択は、サポートされているデータ ソース、ラベルおよびオートメーションの種類など、いくつかの要素に応じて異なります。

主要な考慮事項の 1 つは、ラベル付けを行うデータの種類です。

  • データがイメージコレクションである場合,イメージ ラベラーアプリを使用します。"イメージ コレクション"は、サイズがさまざまなイメージの順番付けのないセットです。たとえば、アプリを使用して、書籍のイメージにラベルを付け、分類器に学習させることができます。イメージ ラベラーは、非常に大きいイメージ (最低でも、1 つの次元が 8K を超える) を扱うこともできます。

  • データが単一のビデオまたはイメージ シーケンスである場合、ビデオ ラベラーアプリを使用します。"イメージ シーケンス"は、ビデオに似たイメージの順番付けされたセットです。たとえば、このアプリを使用して、ハイウェイを走行している車両のビデオまたはイメージ シーケンスにラベルを付け、オブジェクト検出器に学習させることができます。

  • ビデオ、イメージ シーケンス、または LIDAR の信号など、時間がオーバーラップした信号がデータに複数含まれている場合は、グラウンド トゥルース ラベラー(Automated Driving Toolbox)アプリを使用します。たとえば、車両に取り付けられた複数のセンサーによって取得した単一のシーンのデータにラベルを付けることができます。

  • データが LIDAR 信号のみの場合は、LIDAR ラベラー(Lidar Toolbox)を使用します。たとえば、このアプリを使用して、点群センサーから取得されたデータにラベルを付けることができます。

  • データがシングルチャネルまたはマルチチャネルの 1 次元信号で構成されている場合は、信号ラベラー(Signal Processing Toolbox)を使用します。たとえば、生物医学、音声、通信、または振動のデータにラベルを付けることができます。音声検出、音声からテキストへの文字起こし、新しい音声の録音など、音声関連のタスクを実行するには、Audio Labeler(Audio Toolbox)アプリを使用します。

この表は、ラベル付けアプリの主な機能をまとめたものです。

ラベル付けアプリ データ ソース ラベルのサポート オートメーション 追加機能
イメージ ラベラー
  • イメージ コレクション

  • 非常に大きいイメージ (最低でも、1 つの次元が 8K を超える)

  • 四角形の関心領域 (ROI)

  • 投影された直方体 (ROI)

  • ライン ROI

  • ピクセル ROI

  • 多角形 ROI

  • サブラベル

  • 属性

  • シーン

  • 組み込みのオートメーション アルゴリズム

  • カスタム オートメーション アルゴリズム

  • ブロック化されたイメージのオートメーション アルゴリズム

  • ラベル付けされたデータの視覚的な概要を表示する

ビデオ ラベラー
  • ビデオ

  • イメージ シーケンス

  • カスタム イメージ データ ソース

  • 四角形 ROI

  • 投影された直方体 (ROI)

  • ライン ROI

  • ピクセル ROI

  • 多角形 ROI

  • サブラベル

  • 属性

  • シーン

  • 組み込みのオートメーション アルゴリズム

  • カスタム オートメーション アルゴリズム

  • 時間的オートメーション アルゴリズム

  • ラベル付けされたデータの視覚的な概要を表示する

グラウンド トゥルース ラベラー(Automated Driving Toolbox)
  • ビデオ

  • イメージ シーケンス

  • カスタム イメージ データ ソース

  • 点群シーケンス (PCD または PLY ファイル)

  • Velodyne®LIDAR ファイル

  • rosbag (ROS Toolboxが必要)

  • 四角形 ROI

  • 投影された直方体 (ROI)

  • 直方体 ROI

  • ライン ROI

  • ピクセル ROI

  • 多角形 ROI

  • サブラベル

  • 属性

  • シーン

  • 車両検出アルゴリズムや車線検出アルゴリズム、点群時間的内挿アルゴリズムなどの組み込みのオートメーション アルゴリズム

  • カスタム オートメーション アルゴリズム

  • 時間的オートメーション アルゴリズム

  • 多重信号オートメーション

  • ラベル付けされたデータの視覚的な概要を表示する

  • LIDAR や CAN バス データといった時間同期信号を表示するために外部ツールをアプリに接続する

  • 追加のデータ ソースをサポートするために、読み込みインターフェイスをカスタマイズする

LIDAR ラベラー(Lidar Toolbox)
  • 点群シーケンス (PCD または PLY ファイル)

  • Velodyne LIDAR ファイル

  • LAS/LAZ ファイル シーケンス

  • rosbag (ROS Toolbox が必要)

  • 直方体 ROI

  • 属性

  • シーン

  • LIDAR オブジェクト トラッカーや点群時相内挿などを含む、組み込みのオートメーション アルゴリズム

  • カスタム オートメーション アルゴリズム

  • 時間的オートメーション アルゴリズム

  • 直方体のラベルを上面図、側面図、正面図で表示する

  • カスタム カメラ ビューを保存して再利用する

  • 外部ツールに接続して、ビデオなどのラベル付けを簡単にするために時間同期信号を表示し、ラベル付け時の参照として使用する

信号ラベラー(Signal Processing Toolbox)
  • 数値配列、MATLAB®timetable、MATLAB ワークスペース内のlabeledSignalSetオブジェクト

  • MAT ファイルと CSV ファイル

  • オーディオファイル (WAVE、OGG、FLAC、AU、AIFF、AIFC、MP3、MPEG-4 AAC)

  • 時間ベースの ROI

  • 時間ベースの点

  • 属性

  • サブラベル

  • 組み込みのピーク ラベル付け

  • カスタム オートメーション アルゴリズム

  • ラベル付けされたデータの詳細を展開、折りたたみ、参照する

  • 信号スペクトルとスペクトログラムを表示する

  • スペクトログラムを使用して ROI と点にラベルを付ける

  • 信号に一括でラベルを付ける

  • ラベル ビューアーを使用してラベルを表示および比較する

Audio Labeler(Audio Toolbox)
  • オーディオファイル (WAVE、OGG、FLAC、AU、AIFF、AIFC、MP3、MPEG-4 AAC)

  • MATLAB ワークスペースまたは MAT ファイル内のlabeledSignalSetオブジェクト

  • 時間ベースの ROI

  • ファイル レベルのラベル

  • 音声検出

  • 音声からテキストへの文字起こし (speech2text用の Audio Toolbox 拡張機能が必要)

  • 音声の再生

  • 音声の録音

  • オーディオファイル情報の検査

関連するトピック