AIの本と用語検索

最大値プーリング

最大値プーリングは、ニューラルネットワーク、特に畳み込みニューラルネットワーク(CNN)において、層間で特徴マップのサイズを縮小し、最も顕著な特徴を抽出するために使用される手法です。この処理は、ネットワークが過学習するのを防ぎ、処理の計算コストを下げるのに役立ちます。

具体的には、入力された特徴マップを重複しない小さな領域(たとえば2×2ピクセル)に分割します。次に、その分割された小さな領域ごとに、含まれるすべての数値の中で最も大きな値を一つだけ選び出します。

この選び出された最大値が、元の小さな領域を代表する新しい値として、出力される新しい特徴マップの対応する位置に配置されます。

このプロセスを通じて、元の特徴マップの次元(幅と高さ)は縮小されます。たとえば、2×2の領域で最大値プーリングを行うと、出力の特徴マップは入力の約半分のサイズになります。

最大値プーリングの重要な点は、小さな領域内の最も重要な情報(つまり、最も高い活性化値)を保持しつつ、それ以外の細かな情報を捨てることで、モデルが入力データのわずかな位置の変化に対してロバスト(頑健)になることです。

これにより、ネットワークが物体の位置が少しずれていても、それを認識する能力を高めることができます。結果として、ネットワークはより効率的に学習し、汎用性の高い特徴表現を獲得できるようになります。