拡散モデル｜AI用語集｜AI・人工知能の本を探すなら

拡散モデルは、近年、画像生成をはじめとする様々な分野で注目を集めている深層生成モデルの一種です。このモデルは、順方向拡散過程と逆方向拡散過程という２つの段階で構成されています。

順方向拡散過程では、ノイズを段階的に元のデータに付加していくことで、最終的にガウスノイズのみの状態にまで劣化させます。この過程はマルコフ連鎖によってモデル化され、各ステップでのデータの状態は、直前のステップの状態にわずかなノイズが加えられることで生成されます。

このプロセスを逆転させることが、拡散モデルの核心である逆方向拡散過程です。逆方向拡散過程では、ノイズのみの状態から、順方向拡散過程で付加されたノイズを徐々に除去していくことで、元のデータを再構築します。

具体的には、ニューラルネットワーク、特にU-Netのようなアーキテクチャを用いて、各ステップで加えられたノイズを予測し、それをデータから差し引くことでデノイズを行います。

このモデルの学習は、ノイズが付加された各ステップのデータから、そのステップで加えられたノイズを正確に予測するようにニューラルネットワークを訓練することで行われます。

このように、拡散モデルはノイズの付加と除去という単純なメカニズムを通じて、極めて多様で高品質なデータを生成する能力を獲得しています。

このアプローチは、VAEやGANといった従来の生成モデルとは異なり、学習過程が比較的安定しており、モード崩壊のような問題が起こりにくいという利点を持っています。