パナソニック、見た目の多様性が大きな画像認識を可能にするAI技術を開発

パナソニックホールディングスは、画像認識AIの課題である「種類や撮影条件によって同一カテゴリ内の見た目が多様になる」ケースでも精度よく認識可能なAI技術を開発しました。




画像認識AIは、画像中の物体の特徴を捉えてカテゴリを分類することで、物体の認識を実現します。

しかし、同じカテゴリに属する物体でも、見た目が大きく異なる場合や、撮影条件の違いにより見た目が異なる場合があります。このような見えの多様性をどう扱うかが、画像認識AIの課題となっています。

従来は、サブカテゴリ内の類似性や同一カテゴリに共通する特徴を見つけられるよう分類アルゴリズムを工夫することで、多様性に左右されず頑健に認識することを目指してきました。

しかし大量の多様な画像を扱うようになると、同一カテゴリ内に「見えの傾向が異なる、より細かいカテゴリ」が存在する場合(多峰性分布)、「共通する特徴を見つける」というアプローチでは、それらをうまく同じカテゴリの物体として推定できなくなり、認識精度の低下をもたらすことが知られています。

そこで、見えの違いを敢えて生かすことに着目し、2次元の正規直交行列により画像の多様性を捉える分類アルゴリズムを新たに開発しました。

このアルゴリズムは、画像の特徴を2次元空間にマッピングすることで、見えの傾向が異なるカテゴリを明確に区別することができます。

ベンチマークデータセットを用いた実証実験では、AIが苦手とする「多峰性分布」のデータに対しても、従来の手法と比較して高精度に画像分類を行えることを実証しました。

パナソニックHD、多様な画像特徴を滑らかに捉える画像分類AIを開発

NEW POST