AIに「錯視」を再現することに成功 – AI BIBLIO（人工知能ビブリオ）

脳に錯覚を引き起こす「錯視」を人工知能（AI）のひとつである深層学習機で再現することに生理学研究所の研究グループが成功しました。深層学習機を使って脳の動作原理を解明できる可能性が示されました。

深層学習機で脳機能の再現を検証する

人工知能の技術では、人間の脳の神経ネットワーク原理をコンピューター上に再現して、従来よりも高度な演算を可能にする技術が数多く開発されています。

しかし一方で、神経ネットワークをコンピューター上に構築した「人工脳」から脳の動作原理を研究することもまた可能になります。

そこで生理学研究所の研究グループは、脳の動作原理を再現した深層学習機を構築して、人間の脳に特有な「錯視」に注目することで、脳機能の再現を検証する実験を行いました。

錯視とは、画像の中に表示されている対象物の大きさや色が実際のものとは異なるように見えてしまう現象です。

今回実験に用いた錯視は北岡明佳博士が考案した「蛇の回転錯視」と呼ばれるものです。

この錯視画では、実際には静止画であるにもかかわらず、とぐろを巻いた蛇がの模様が回転しているように知覚されます。

この画像を人工知能が認識した際、人間の脳と同じように錯視の現象が引き起こされるのでしょうか。

研究では、構築された深層学習機が「回転している」と予測するのであれば、深層学習機も人間と同様に錯視を再現している可能性があると判断しました。

実験では、深層学習機に「予測符号化理論」を組み込みました。

予測符号化理論では、大脳は入力される感覚情報を常に予測しており、実際に得られた感覚情報と予測との差を学習していくものとしています。

今回構築した深層学習機でも、この理論を組み込んで蛇の回転錯視が再現されるかどうかを検証しました。

深層学習機に人間の視覚情報を学習させるため、上のような日常の動画を入力しました。動画は帽子の上に取り付けられたカメラで撮影された動画で、遊園地内を歩きながら撮影されたものです。

約5時間分の動画を深層学習機に入力しており、これらはおよそ53万フレーム分に相当します。

まず、学習した深層学習機が回転運動を予測できるかについて、プロペラを撮影した画像を使って検証しました。その結果、プロペラの回転の方向までうかく予測することができました。

次に、蛇の回転錯視画像を使って検証しました。蛇の回転錯視は、色の配列を変更すれば右回転と左回転、無回転の知覚を引き起こすことができます。

左の画像は蛇の回転錯視。右の画像は無回転の画像です。

実際に右回転、左回転、そして無回転の錯視画像を深層学習機に入力したところ、それぞれ人間に引き起こす錯視と同じように回転運動の予測をすることが明らかになりました。

この結果は、深層学習機は人間と同じように錯視を知覚することを示すもので、そして回転錯視を引き起こすメカニズムのひとつとして、予測符号化理論が有力であることも示しています。

今回の研究結果から、深層学習機が人間の動作メカニズムの解明にも貢献できると期待されます。