AIの本と用語検索

AUC

AUC(Area Under the Curve)は、モデルの性能評価指標の一つであり、特に二値分類問題において広く用いられます。これはROC曲線(Receiver Operating Characteristic curve)の下部の面積を指すもので、その値は0から1の範囲に収まります。

ROC曲線は、縦軸に真陽性率(True Positive Rate: TPR)または感度、横軸に偽陽性率(False Positive Rate: FPR)または1 - 特異度をプロットしたもので、モデルが様々な閾値において、どの程度の判別能力を持つかを示します。

AUCの値が1に近いほど、モデルは陽性と陰性のサンプルを高い精度で区別できる、つまり性能が良いと評価されます。これは、ランダムに選ばれた陽性サンプルと陰性サンプルに対し、陽性サンプルの方が高い確率スコアを持つとモデルが予測する確率に等しいと解釈できます。

逆に、AUCが0.5であれば、モデルの予測はランダムな推測と大差なく、分類能力がないことを示します。また、0.5を下回る場合は、予測の向きを反転させることで性能を改善できる可能性があります。

AUCは、データセットにおけるクラスの不均衡(一方のクラスのサンプル数が極端に少ない場合など)の影響を受けにくいという利点があります。この特性から、医療診断や不正検知など、陽性サンプルが稀なケースの予測において特に有用な指標として活用されています。