AIの本と用語検索

U-Net

U-Netは、画像セグメンテーションというタスク、つまり画像内の各ピクセルが何に属するかを特定・分類するために特化して設計された畳み込みニューラルネットワーク(CNN)の一種です。

特に、医療画像解析(医用画像からの腫瘍や臓器の検出・領域分割など)のために2015年に開発されましたが、その高い汎用性から現在では様々な画像解析分野で活用されています。

U-Netの最大の特徴は、アルファベットの「U」の字に似た対称的な構造にあります。この構造は大きく分けて二つの経路から構成されています。

一つは画像の情報を徐々に縮小し、画像の大まかな特徴を抽出していく「エンコーダ」(符号化器)経路です。もう一つは、縮小された特徴マップを徐々に拡大し、元の画像サイズに戻してピクセルごとの分類結果を出力する「デコーダ」(復号化器)経路です。

重要な点は、このエンコーダとデコーダが、同じ解像度を持つ階層間で直接情報を伝達するスキップ接続(ショートカット接続)を持っていることです。このスキップ接続により、エンコーダで失われがちな詳細な位置情報がデコーダに届けられ、結果として非常に精密な領域分割が可能になります。

この独特の構造とスキップ接続のおかげで、U-Netは比較的少ない学習データでも高い性能を発揮できるという利点も持っています。これにより、医療分野など、データ収集が難しい領域での画像解析に大きな進歩をもたらしました。