再現率(Recall) は、特に分類タスクの性能を評価する重要な指標の一つです。これは、真に陽性であると判断すべきデータ群のうち、AIモデルがどれだけの割合を正しく「陽性」と識別できたかを示すものです。
数学的には、真陽性 (True Positive) の数値を、真陽性と偽陰性 (False Negative) の合計で割ることで算出されます。
偽陰性とは、実際には陽性であるにもかかわらず、モデルが誤って陰性と予測してしまったケースを指します。したがって、再現率が高いということは、モデルが対象となる陽性事例を見落とすリスクが低いことを意味します。
この指標は、医療分野における病気の診断や、不正取引の検出など、陽性事例の見逃しが重大な結果を招く可能性がある場面で特に重要視されます。
しかしながら、再現率を向上させるだけでは、必ずしもモデルの全体的な性能が優れているとは言えません。なぜなら、モデルが「陽性」と予測する基準を緩くしすぎると、多くの偽陽性(実際には陰性だが陽性と予測されるケース)が発生し、適合率(Precision)が低下する可能性があるからです。
そのため、再現率と適合率はトレードオフの関係にあり、両者のバランスを考慮した上で、F1スコアのような統合的な指標も用いられます。モデルの応用目的や、見逃しと誤検知のどちらをより避けるべきかによって、これらの指標の重要度は変化します。
