ナノサイズの人工ニューロンを開発、音声認識で高い正答率を達成

ナノメートルサイズの人工ニューロンを産業技術総合研究所の研究チームが開発して、その原理の実証実験に成功しました。

人間の脳での情報処理を模倣した「ニューロモロフィック・コンピューティング」に用いて音声認識に成功しており、人工知能の研究開発の促進につながると期待されます。

ニューロモロフィック・コンピューティング

人間の脳では、膨大な数のニューロンをシナプスがつないだ神経回路網が張り巡らされています。この神経回路を使って情報伝達を行うことで、コンピューターで言うところの演算処理が行われています。

一方、人間の脳でのニューロンとシナプスによる情報処理を模倣する「ニューロモロフィック・コンピューティング」の研究が進められています。

このコンピューターは、情報伝達の起点となっているニューロンと、それをつなぐシナプスから構成されており、従来のコンピューターと比べて消費電力が低く、そして脳が得意とする「認識」や「学習」といった情報処理が可能になると期待されています。

ニューロモロフィックシステムでは、脳内におけるニューロンやシナプスを人工的な素子に置き換えています。

従来のコンピューターでは音声認識やパターン認識などの処理には人間の脳と比べて１万倍以上の消費エネルギーを要するとされており、また演算回路が大きくなるといった課題が挙げられています。

ニューロモロフィックシステムでは高効率かつ超小型の人工ニューロンや人工シナプスを使うことで、より高度な情報処理ができると期待されています。

産業技術総合研究所ではこれまでに、超小型の「スピントルク発振素子」を実用化する研究を行ってきました。

この発振素子は直流電流を流すと交流電圧が発生しますが、この交流電圧の振幅は入力される電流の変化に瞬間的に従って変化せず、時間的な遅れが発生します。この遅れは「緩和時間」と呼ばれています。

また、発生する交流電圧の振幅の大きさは入力される電流の大きさに比例せず、いわゆる「非線形」な振る舞いをします。

この「緩和時間」や「非線形」といった特徴は、ニューロモロフィックシステムで必要とされる「短期記憶（短い時間だけ保持される記憶で、時間とともに情報が消える）」や信号の非線形性に合致するため、人工ニューロンとしての利用が可能になることがわかりました。

研究では、このスピントルク発振素子を人工ニューロンとして用いたニューロモロフィックシステムを構築して、音声認識の実験を行いました。

５人が発する０から９までの数字（英語）の音声データを使って学習をさせて、音声認識の成功率を測定しました。

まず、人間が発した音声信号（a）に処理を施して入力信号（b）を作成しました。

入力信号（b）をスピントルク発振素子からなるニューロン回路に入力したところ、出力信号（c）が得られました。この出力信号を音声認識プログラムに処理させて学習させます。

グラフ（d）は学習回数を増やすことによる音声認識の成功率の変化を示しています。「発振素子あり」は今回構築した回路を使った実験結果です。

一方、「発振素子なし」は入力信号（b）を直接そのまま音声認識プログラムに処理させた場合です。

両者を比べると、発振素子を介した回路の方が学習回数が少なくても音声認識の成功率が高いことがわかります。最大で正答率は99.6%に達しました。この正答率は、より大型で複雑な光学系のリザーバーコンピューターと同レベルの高さです。

つまり、今回の実証実験からスピントルク発振素子を人工ニューロンとして利用することが可能であり、ニューロモロフィックシステムの高度化に寄与することがわかりました。

研究チームは今後、「人工シナプス」を新たに接続したより高度なニューロモロフィックシステムの開発を目指すとしています。

スピントルク発振素子（STO）：ナノメートルサイズの磁気抵抗素子に直流電流を流し、素子の両端に交流電圧を生じさせる。電子がもつ磁石としての性質（スピン）によって、素子に含まれる強磁性体の中のスピンが共鳴的な歳差運動を起こす。
Neuromorphic computing with nanoscale spintronic oscillators（nature誌）

IMAGE1SOURCE1