AIの本と用語検索

決定木

決定木は、分類や回帰のタスクに用いられる機械学習アルゴリズムの一種です。このモデルは、フローチャートのような階層的なツリー構造を形成することで、データの特徴に基づいて意思決定を行うプロセスを視覚的に表現します。

決定木は、ルートノードから始まり、データが持つ複数の特徴量に基づき、特定の条件でサブノードへと分岐していきます。

各ノードでは、データを最も効率的に分割できるような特徴量と閾値が選択されます。この分割は、データの純度、つまり同じクラスに属するサンプルの割合を最大化するように反復的に行われます。この純度の評価には、ジニ不純度やエントロピーといった指標が一般的に用いられます。

ツリーの末端に位置する葉ノードは、最終的な予測結果を示します。分類問題の場合、各葉ノードは特定のクラスラベルを、回帰問題の場合は数値の予測値を保持します。

決定木は直感的で解釈しやすいという利点がある一方で、過学習に陥りやすいという弱点も持ち合わせています。この問題に対処するため、ツリーの成長を制限する剪定や、複数の決定木を組み合わせるアンサンブル学習(例:ランダムフォレスト、勾配ブースティング)といった手法が広く用いられています。

決定木は、複雑なモデルの挙動を理解するための基礎的なツールとして、また高性能なアンサンブルモデルの構成要素として、機械学習において重要な役割を担っています。