AIの本と用語検索

F1スコア

F1スコアは、分類モデルの性能を総合的に示すための重要な指標です。これは、特にデータセットのクラス分布が不均衡である場合に、単一の指標(例えば正解率)では捉えきれないモデルの真の性能を評価するのに役立ちます。

F1スコアは、適合率(precision)と再現率(recall)という二つの主要な指標の調和平均として計算されます。

適合率は、モデルが「陽性」と予測したもののうち、実際に正しかったものの割合を示します。これは、誤って陽性と判断する偽陽性(false positives)をどれだけ少なくできたかを測る指標です。

一方、再現率は、実際の陽性データのうち、モデルがどれだけ正しく「陽性」と予測できたかを示し、偽陰性(false negatives)をどれだけ見逃さなかったかを測る指標となります。

この計算式からわかるように、F1スコアは適合率と再現率が両方とも高い場合に最大値である1に近づきます。どちらか一方が極端に低い場合、F1スコアも低くなります。

例えば、あるモデルが陽性を一つも予測せず、すべてを陰性と予測した場合、再現率は0となり、F1スコアも0になります。逆に、すべてを陽性と予測した場合、適合率が低くなり、やはりF1スコアは低くなります。

このように、F1スコアは適合率と再現率のバランスを考慮に入れた上で、モデルの性能を包括的に評価するための強力なツールとなります。