深層生成モデル｜AI用語集｜AI・人工知能の本を探すなら

深層生成モデルは、ディープラーニングを用いて、訓練データに存在するパターンや特徴を学習し、その学習した知識に基づいて全く新しいデータを生成する人工知能モデルの総称です。このモデルの核となるのは、与えられたデータが持つ潜在的な構造（データの背後にある分布）を捉える能力です。

従来の識別モデルが「入力された画像が猫か犬か」を判別するのに対し、生成モデルは「本物の猫や犬のような画像」そのものを生み出すことを目的としています。深層学習、すなわち多層のニューラルネットワークを用いることで、非常に複雑で高次元なデータ、例えば高解像度の画像や自然な文章、音声をリアルに生成できるようになりました。

代表的なモデルとしては、二つのネットワークが互いに競い合いながら学習を進める敵対的生成ネットワーク (GAN) や、データの潜在的な表現を確率分布として捉える変分オートエンコーダ (VAE)、最近の画像生成で目覚ましい成果を上げている拡散モデルなどがあります。

これらのモデルは、大量のデータからその本質的な構造を学び取るため、画像生成、音声合成、文章作成、さらには医療分野での異常検知やデータ拡張など、多岐にわたる分野で応用され、現実世界に存在するデータと見分けがつかないほどの高品質なコンテンツの創出を可能にしています。深層生成モデルは、AIによるクリエイティブな活動を大きく進化させた技術と言えます。