正解率(Accuracy)とは、機械学習モデルの性能を評価する最も基本的な指標の一つです。これは、モデルが予測した結果のうち、実際に正しいと判断された割合を示す値であり、全データセットにおける正解予測の数を全体の予測数で除算することによって算出されます。
例えば、分類問題において、モデルが100個のサンプルを分類したとします。そのうち90個が正しく分類された場合、正解率は90パーセントとなります。これは、(正解数 / 全サンプル数) 100という計算式で表現されます。
しかし、正解率の評価には注意が必要です。特にデータセットが不均衡である場合、すなわち、あるクラスのサンプル数が他のクラスに比べて圧倒的に多い場合、モデルが単純に多数派のクラスを予測するだけで高い正解率を示すことがあります。このような状況では、正解率だけを指標とすると、モデルの真の性能を見誤る可能性があります。
このため、より詳細な評価を行うためには、正解率だけでなく、適合率 (Precision) や 再現率 (Recall)、さらにはそれらを統合したF1スコアなどの指標を併用することが一般的です。
これらの指標は、モデルの予測が真陽性 (True Positive)、真陰性 (True Negative)、偽陽性 (False Positive)、偽陰性 (False Negative) のいずれに分類されるかを基に計算され、モデルの性能を多角的に分析することができます。
したがって、単一の指標に依存するのではなく、複数の評価指標を総合的に考慮することが、AIモデルの性能を適切に理解する上で不可欠です。
