セマンティック セグメンテーションは、画像内のすべてのピクセルを道路、建物、歩行者などのカテゴリに分類するコンピューター ビジョン タスクです。
目的
その目的は、自動運転、医療用画像処理、ロボット工学における AI アプリケーションに詳細なシーン理解を提供することです。
重要性
- 安全性が重要となるシステムにおけるピクセルレベルの認識に不可欠です。
- 境界ボックスと比較して正確なオブジェクト境界を有効にします。
- 大規模な注釈付きデータセットが必要です。
- 高解像度では計算負荷が高くなります。
仕組み
- ピクセルレベルの注釈付き画像を収集してラベル付けします。
- 完全畳み込みネットワークのようなディープラーニングモデルをトレーニングします。
- 入力画像はピクセルレベルの予測に処理されます。
- 出力マスクは各ピクセルをクラスに割り当てます。
- Intersection over Union (IoU) などのメトリックを使用して評価します。
例(実世界)
- 都市景観データセット: 都市シーンのセマンティックセグメンテーション。
- Tesla Autopilot: 道路ナビゲーションのためのピクセルレベルのセグメンテーション。
- 医用画像: MRI スキャンで腫瘍をセグメント化します。
参考文献 / さらに読む
- Longら「セマンティックセグメンテーションのための完全畳み込みネットワーク」CVPR 2015。
- 都市景観データセット。
- IEEE 医療画像トランザクション。