F値とは、モデルの性能を評価するための指標の一つで、特に分類タスクにおいて重要な役割を果たします。この指標は、適合率(Precision)と再現率(Recall)という二つの主要な評価尺度を統合して算出されます。
適合率は、モデルが「陽性」と予測したもののうち、実際に正しかったものの割合を示します。これは、偽陽性(False Positive)をどれだけ少なくできたかを表す指標です。
一方、再現率は、実際の正例(真陽性:True Positive)のうち、モデルがどれだけ正しく「陽性」と予測できたかを示します。これは、偽陰性(False Negative)をどれだけ見逃さなかったかを表す指標です。
F値は、これら適合率と再現率の調和平均として計算されます。単純な算術平均ではなく調和平均を用いるのは、適合率と再現率のどちらか一方が極端に低い場合に、その低さをより厳しく反映させるためです。これにより、両者のバランスが取れたモデルの評価が可能になります。
F値には、通常、適合率と再現率を等しく重要視するF1スコアがよく使われます。これは、適合率と再現率の重み付けを等しくした特別なケースです。
また、特定の目的に応じて、適合率や再現率に異なる重み付けを行うFβスコアも存在します。例えば、偽陽性を避けることをより重視する場合は、適合率に重みを置いたFβスコアが用いられます。
このように、F値は単一の数値でモデルの性能を包括的に評価する上で、非常に有効なツールです。
