VAE｜AI用語集｜AI・人工知能の本を探すなら

VAE（Variational Autoencoder）は、データの潜在的な構造を学習する生成モデルの一種です。これは、2つの主要なネットワーク、すなわちエンコーダとデコーダで構成されます。

エンコーダは入力データを低次元の潜在空間にマッピングし、その際に単一の点ではなく、平均と分散によって定義される確率分布として表現します。

このアプローチは、通常のオートエンコーダが潜在空間の単一の点にデータを圧縮するのとは異なり、データの多様性や連続的な変化を捉えることを可能にします。

エンコーダによって得られた確率分布から、サンプリングというプロセスを通じて潜在ベクトルが生成されます。このサンプリングされた潜在ベクトルは、デコーダへの入力となります。デコーダは、この潜在ベクトルを元のデータ形式に再構築することを目指します。

学習プロセスでは、再構成誤差と潜在空間における分布の正則化という二つの目的を同時に最小化するようにネットワークの重みが調整されます。

再構成誤差は、デコーダが出力したデータが元の入力データとどれだけ似ているかを示し、分布の正則化は、エンコーダが生成する確率分布が、特定の事前分布（通常は標準正規分布）に近くなるように促します。

この正則化項は、潜在空間が滑らかで連続的になるように働き、補間や新しいデータの生成を可能にします。VAEは、画像の生成、異常検知、データ補間など、幅広い応用分野で利用されています。