混同行列｜AI用語集｜AI・人工知能の本を探すなら

混同行列は、機械学習モデルの分類性能を評価するための重要なツールで、特に二値分類や多クラス分類の文脈で用いられます。モデルが予測したクラスと、実際の正解クラスとの一致度を視覚的かつ定量的に表現するものです。

具体的には、混同行列は正解と予測の組み合わせを四つの主要なカテゴリに分類します。

真陽性（True Positive: TP）は、モデルが正と予測し、実際に正解も正であったケースです。これはモデルが正しく陽性クラスを識別したことを意味します。次に、偽陽性（False Positive: FP）は、モデルが正と予測したものの、実際には負であったケースです。これはタイプIエラーとも呼ばれ、誤って陽性と判断した事例です。

一方、真陰性（True Negative: TN）は、モデルが負と予測し、実際に正解も負であったケースです。モデルが正しく陰性クラスを識別したことを示します。

最後に、偽陰性（False Negative: FN）は、モデルが負と予測したものの、実際には正であったケースです。これはタイプIIエラーとも呼ばれ、陽性を見逃した事例です。

これらの要素を用いて、精度（Precision）、再現率（Recall）、そしてF1スコアといった様々な評価指標を算出することができます。

例えば、精度はTP / (TP + FP)で計算され、陽性と予測したうち、実際に陽性であった割合を示します。混同行列を分析することで、モデルがどのような種類の誤分類を犯しやすいのか、その傾向を詳細に把握し、モデルの改善点を見つけ出すことが可能となります。