ディープラーニング技術を応用した「GAN(敵対的生成ネットワーク)」を使うことで、架空のアイドルの顔画像を高解像度で生成する「アイドル自動生成AI」を開発したと、データグリッドが発表しました。
人工知能(AI)ではクリエイティブな活動は難しいと、これまでは言われてきました。しかし最近ではAIによる生成技術の研究が進んでおり、その精度は向上しています。
今回、データグリッドではクリエイティブAIの開発を加速する目的で、画像生成分野における研究成果を応用したアイドル画像生成に取り組みました。その結果、高い解像度と品質をもった顔画像の生成に成功したとしています。
新たに開発した「アイドル自動生成AI」では、Generative Adversarial Network(GAN)と呼ばれる技術を応用しています。
近年の機械学習は特に画像分野で急速な発展を遂げていますが、一般的なディープラーニングではいわゆる「教師あり学習」によって主に画像を認識する能力を向上させており、そのため新たに生み出すクリエイティブなものは苦手とされてきました。
しかし、GAN(敵対的生成ネットワーク)は「教師なし学習」の機械学習であり、画像の生成が可能です。GANはIan Goodfellow氏が考案したモデルです。
GANではGeneratorとDiscriminatorという2種類のネットワークが働いています。Generatorは「本物」と同じ内容の生成物を生み出そうとして、その一方で、Discriminatorはそれが本物なのか「レプリカ」なのかを識別します。
Generatorはなるべく本物に近いレプリカを作ろうとしますが、それに対してDiscriminatorは本物とレプリカを確実に識別するように努力することで、お互いに競い合うような仕組みになっています。
これらの2種類のネットワークが互いに競い合いながら学習を進めていくことで、精度が向上していきます。(参考:人工知能の注目トレンド「GAN:敵対的生成ネットワーク」とは)
今回、データグリッドはGANの技術を応用することでAIにアイドルの顔画像を学習させて、アイドルの特徴を捉えて本物に極めて近い顔画像を生成することに成功しました。
同社では今後、これらの生成技術をほかの分野にも応用することで、価値のあるコンテンツを生成するクリエイティブAIの研究開発を進めていきます。将来的には画像の生成のみならず、音楽やテキストの生成についても研究開発を予定するとしています。