アリババクラウドがAI画像生成モデル「通義万相」を発表

アリババクラウドがAI画像生成モデル「通義万相」を発表しました。また、言語や視覚、音声など複雑で専門的なAIタスクを支援するためのフレームワーク「ModelScopeGPT」もまた発表しました。




通義万相は、さまざまなタスクを処理することに優れた生成AIです。中国語や英語のテキストプロンプトに応答し、水彩画や油彩画、中国画、アニメーション、スケッチ、フラットイラスト、3D漫画など、さまざまなスタイルの画像を生成します。

また、このモデルは任意の画像を類似したスタイルの新しい画像に変換したり、スタイル転送によって画像をスタイリッシュに変化させることが可能です。

これによって、元の画像の内容を保持しながら別の画像の視覚スタイルを適用することができます。

このモデルは多言語素材を活用してトレーニングを強化しており、意味理解能力が高く、文脈に即したより正確な画像生成を実現します。

さらに、高解像度の拡散プロセスをS/N比に基づいて最適化することで、構図の正確さと鮮明なディテールをバランスよく保ちながら高コントラストで視覚的に美しい背景画像を生成する能力を強化しています。

NEW POST