バウンディングボックス

バウンディングボックス

バウンディングボックスとは、画像や動画内のオブジェクトの周囲に配置される長方形の注釈です。コンピュータービジョンモデルのトレーニングにおいて、オブジェクトの位置とサイズを定義します。

目的

目的は、AIシステムが画像内の物体を検出し、その位置を特定することを学習できるように、ラベル付きのサンプルを提供することです。境界ボックスは物体検出タスクの基本です。

重要性

  • コンピューター ビジョンにおける最も単純かつ最も一般的な注釈タイプ。
  • YOLO や Faster R-CNN などのモデルのトレーニングに必要です。
  • 不規則な形状のオブジェクトの場合、精度が制限されます。
  • ポリゴンやマスクなどの高度な注釈の基礎。

仕組み

  1. 検出するオブジェクト カテゴリを定義します。
  2. 画像内のオブジェクトの周囲に四角形を描画します。
  3. 座標を注釈データとして記録します。
  4. 品質チェックで検証します。
  5. 注釈付きデータを使用してオブジェクト検出モデルをトレーニングします。

例(実世界)

  • COCO データセット: 一般的なオブジェクトの境界ボックス注釈。
  • Tesla Autopilot: 車両と歩行者の境界ボックス。
  • Amazon Go ストア: コンピューター ビジョン チェックアウト システムで使用される境界ボックス。

参考文献 / さらに読む

こんな商品もお勧めしています

次のAIイニシアチブをどのように支援できるか教えてください。