F1スコア｜AI用語集｜AI・人工知能の本を探すなら

F1スコアは、分類モデルの性能を総合的に示すための重要な指標です。これは、特にデータセットのクラス分布が不均衡である場合に、単一の指標（例えば正解率）では捉えきれないモデルの真の性能を評価するのに役立ちます。

F1スコアは、適合率（precision）と再現率（recall）という二つの主要な指標の調和平均として計算されます。

適合率は、モデルが「陽性」と予測したもののうち、実際に正しかったものの割合を示します。これは、誤って陽性と判断する偽陽性（false positives）をどれだけ少なくできたかを測る指標です。

一方、再現率は、実際の陽性データのうち、モデルがどれだけ正しく「陽性」と予測できたかを示し、偽陰性（false negatives）をどれだけ見逃さなかったかを測る指標となります。

F 1 = 2 \times \frac{／（適合率 + 再現率）}{（適合率 \times 再現率）}

この計算式からわかるように、F1スコアは適合率と再現率が両方とも高い場合に最大値である1に近づきます。どちらか一方が極端に低い場合、F1スコアも低くなります。

例えば、あるモデルが陽性を一つも予測せず、すべてを陰性と予測した場合、再現率は0となり、F1スコアも0になります。逆に、すべてを陽性と予測した場合、適合率が低くなり、やはりF1スコアは低くなります。

このように、F1スコアは適合率と再現率のバランスを考慮に入れた上で、モデルの性能を包括的に評価するための強力なツールとなります。