AIの本と用語検索

転移学習

転移学習とは、特定のタスクで学習済みのモデルを、別の関連するタスクに適用する機械学習の技術です。このアプローチは、ゼロからモデルを訓練するのではなく、既存の知識を再利用する点に大きな特徴があります。

具体的には、あるデータセット(ソースドメイン)で十分に学習された深層学習モデルの、特に特徴抽出を担う下位層のパラメーターを、新しいタスク(ターゲットドメイン)の初期値として利用します。

この手法の最大の利点は、ターゲットドメインのデータ量が少ない場合でも、高い性能を発揮できることです。通常、深層学習モデルをゼロから訓練するには膨大な量のラベル付きデータが必要ですが、転移学習ではその必要性が大幅に緩和されます。

例えば、ImageNetのような大規模な画像データセットで学習した畳み込みニューラルネットワーク(CNN)は、画像認識における汎用的な特徴(エッジ、テクスチャ、形状など)を既に獲得しています。

これを、特定の種類の犬の品種を識別するタスクに転用する場合、モデルの最終出力層のみを新しいタスクに合わせて再構築し、少量のデータでファインチューニングするだけで、効率的にモデルを最適化できます。

このように、転移学習は、学習コストと時間の削減、およびデータ不足の問題を克服する上で極めて有効な手法であり、自然言語処理やコンピュータビジョンなど、多岐にわたるAI分野で広く活用されています。