AIの本と用語検索

zero-shotプロンプティング

zero-shotプロンプティングは、大規模言語モデル(LLM)に特定のタスクを実行させる際、訓練データとしてそのタスクの具体的な例を一切与えない手法です。

従来の機械学習では、新しいタスクを解くために大量のラベル付きデータと再訓練が必要でしたが、zero-shotプロンプティングは、モデルが事前学習で獲得した広範な知識と理解力に依存します。

この手法の鍵は、モデルに対してタスクの内容を明確かつ詳細に記述したプロンプト(指示文)を与えることです。

例えば、「以下のレビューが肯定的か否定的かを判断してください」といった指示がそれにあたります。モデルは、訓練中に学習した一般的な言語パターン、概念、そして世界の知識を応用し、与えられた指示文と入力データ(この場合はレビューテキスト)を照らし合わせることで、タスクを推論的に解決しようと試みます。

zero-shotプロンプティングの大きな利点は、汎用性と効率性です。開発者は、新しいデータセットを作成したりモデルをファインチューニングしたりする手間を省き、多種多様なタスクに迅速に対応できます。

これにより、未知のドメインやニッチなタスクに対しても、一定の性能を発揮することが期待されます。この能力は、LLMが単なるパターン認識機ではなく、ある種の論理的思考や推論能力を獲得していることの証左とも言えます。