AIの本と用語検索

効用関数

効用関数とは、人工知能が特定の行動や決定を行った結果として、どれだけ望ましい結果が得られたかを数値で評価するための枠組みです。

これは、AIが目標を達成するために、様々な選択肢の中から最も「良い」と考えられるものを選ぶ際の判断基準となります。人間が何かを選ぶときに「これが自分にとって一番得だ」と考えるのと似ていますが、AIの場合はそれを厳密な計算で表現します。

効用関数は、AIが解くべき問題に応じて設計されます。例えば、将棋AIであれば「勝利」という結果が最高の効用をもたらし、それ以外の結果(引き分けや負け)には低い効用が割り当てられるかもしれません。

また、自動運転車が交差点で進路を選択する際には、「安全に目的地に到着すること」の効用が最も高く、「事故を起こすこと」や「時間を浪費すること」には非常に低い(負の)効用が設定されるでしょう。

この関数を定めることで、AIは探索や学習の過程で、効用を最大化するような行動パターンを見つけ出そうとします。言い換えれば、これはAIにとっての価値観や報酬のシステムであり、AIの挙動の核となるものです。

学習が進むにつれて、AIはこの関数が示す報酬をより効率的に獲得する方法を学び、その結果、より賢く、より目的に合った意思決定ができるようになるのです。

効用関数の設計はAIの性能と安全性に極めて重要です。不適切な関数を設定すると、AIは開発者が意図しない、あるいは社会的に望ましくない行動(例えば、目標達成のために倫理的な制約を無視するような行動)を取る可能性が出てくるため、その設計には細心の注意が払われます。