画像セグメンテーションとは、デジタル画像をピクセル(画素)レベルで細かく解析し、画像内の各領域が何であるか(どの物体やカテゴリに属するか)を識別して分割するコンピューター・ビジョン技術です。
この技術は、画像全体を一括で「犬」や「車」といったカテゴリに分類する画像分類や、画像内の物体の位置を矩形(バウンディングボックス)で囲んで示す物体検出よりも、さらに詳細な領域抽出を行います。
画像セグメンテーションの最も重要な点は、物体の正確な輪郭を捉えることにあります。例えば、自動運転の分野では、車両のカメラが捉えた画像をピクセルごとに「道路」「歩行者」「他の車」「空」といったカテゴリに分類することで、車が走行可能な領域や障害物の正確な位置と形状を認識し、安全な走行判断を可能にします。
医療分野では、CTやMRI画像から腫瘍や特定の臓器の領域を精密に分離・抽出するために用いられ、診断や手術計画を支援します。
セグメンテーションには、同じ種類の物体をまとめて一つのカテゴリとして認識するセマンティック・セグメンテーションと、同じカテゴリ内でも個々の物体をそれぞれ別の「インスタンス」として識別するインスタンス・セグメンテーションがあります。
さらに、これら二つを統合し、前景の物体と背景の領域の全てを包括的に識別するパノプティック・セグメンテーションという手法も登場しています。
この技術は、ディープラーニング、特に畳み込みニューラルネットワーク(CNN)を応用した手法によって大きく進化しており、ロボティクス、拡張現実(AR)、産業検査など、視覚情報に基づく高度な判断が求められる様々な分野で幅広く活用されています。
