AIの本と用語検索

適合率

適合率(Precision)は、モデルの予測がどれほど正確であったかを評価する指標の一つです。特に分類問題において重要な概念となります。

適合率は、モデルが「陽性」と予測したインスタンスのうち、実際に「陽性」であったインスタンスの割合を示す値です。具体的には、以下の式で計算されます。

ここで、真陽性(True Positive; TP)は、モデルが陽性と正しく予測したインスタンスの数です。一方、偽陽性(False Positive; FP)は、モデルが陽性と誤って予測した、実際には陰性のインスタンスの数です。

適合率が高いモデルは、「誤検出」が少ない、つまり陽性と判断した結果の信頼性が高いことを意味します。例えば、スパムメールの分類モデルを考える場合、適合率が高いモデルは、スパムと判断したメールの中に、誤って正常なメール(非スパム)が含まれている可能性が低いことを示します。

しかし、適合率だけを評価指標とすることは不十分な場合があります。適合率が100%であっても、陽性と予測したインスタンスの数が極めて少ない(例えば、1つしか陽性と予測せず、それがたまたま正しかった)という状況も考えられます。

そのため、適合率と再現率(Recall)は、トレードオフの関係にあり、両者を組み合わせてモデルの性能を総合的に評価することが一般的です。再現率が「見逃し」の少なさを示すのに対し、適合率は「誤検出」の少なさを示すと理解することができます。