ディープラーニング(深層学習)とは機械学習の手法の一つで、特に4層以上など多層のニューラルネットワーク(ディープニューラルネットワーク)を利用したもの。
3層構造以上の層をもった多層ニューラルネットによる学習は、従来は技術的な問題によって十分な学習が得られませんでした。しかし2006年にフェフリー・ヒントンらの研究チームが制限ボルツマンマシンによるオートエンコーダの深層化に成功したことで、注目を浴びるようになりました。
ヒントンらが開発したディープラーニングでは層が直列につなげられたシンプルな構造をしていましたが、現在は複数の分岐やループなどの構造をもつ、より複雑な構造をもちます。
ニューラルネットワークの多層化には、従来は膨大な学習時間や計算コストが必要とされるといった問題がありました。しかし近年では、コンピュータの高性能化や、CPUよりも演算の並列処理に優れたGPUの活用などで解決されました。
ニューラルネットワークを用いた機械学習としては最初の手法である「パーセプトロン」が考案されたのは1957年。しかしながら、コンピュータのスペック不足や「排他的論理和」を認識することができないなど、さまざまな欠点があることで研究は広がりを見せませんでした。
1980年代に入ってから「バックプロパゲーション」が開発されたことで排他的論理和の問題は解決しましたが、1990年代の終わりには再び研究は低迷していきます。
そして2006年、ヒントンらによって多層のネットワークでも精度を失わない手法が提唱され、2012年には物体の認識率を競う競技会「ImageNet Large Scale Visual Recognition Competition(ILSVRC)」においてヒントンらによるトロント大のチームが躍進、その後もディープラーニングを使用したチームが上位を占めるようになりました。
ディープラーニングは物体認識をはじめさまざまな分野で活用されるようになりました。ネットワークモデルは現在においても世界中で研究されており、新しいものが毎年提案されています。
ネットワークモデルについては、畳み込みニューラルネットワーク、スタックドオートエンコーダ、敵対的生成ネットワーク、ボルツマンマシン、制限ボルツマンマシン、回帰結合型ニューラルネットワークなどがあります。
出典・参考