Webブラウザで手軽にディープニューラルネットワークを実行できるシステムを開発

市販のパソコンやスマートフォンのブラウザ上でディープニューラルネットワークを実行できるシステム「WebDNN」を、東京大学の研究グループが開発しました。画像中の物体を認識する処理で、他のソフトウェアと比べて50倍のスピードがあったとしています。




WebブラウザでDNNを実行

ディープニューラルネットワーク(DNN)は人工知能の一種で画像認識や音声認識などで有効な手法だとされています。

しかしWebサービスの中に組み込んで使うためには、多数のユーザーに対応するため、サービスを提供する側が大量の計算機を用意する必要があり、コストが高くなってしまいます。

そのため、ユーザー側のパソコンやスマートフォンで計算させる方法も考えられますが、この場合には専用のアプリケーションをユーザーがインストールする必要があり、手間がかかるため手軽に実行することができません。

そこで、研究グループはDNNの処理を実行するためのソフトウェアをWebページの中に組み込み、ブラウザでページを開いたユーザーの端末で計算処理ができる方法を活用するシステム「WebDNN」を開発しました。

ブラウザ上でDNNを高速処理するフレームワーク「WebDNN」

WebDNNでは、DNNをパソコンやスマートフォンのブラウザ上で使うために、2つの技術を開発しました。

1つ目は計算量の削減で、2つ目はパソコンやスマートフォンなど端末の性能を効率よく引き出すためのWeb最新規格の活用です。

計算量の削減では、たとえば「2×3×変数」という計算を実行する際に「2×3」の部分を事前に計算された「6」に置き換えるような変換をします。WebDNNでは、このような変換ルールを10以上も組み込むことで、計算時間の短縮のほか、処理に必要とされるデータのダウンロード時間をも短縮しています。

端末の性能を引き出す点については、例えば、Safariの現行バージョンに搭載される新規格である「WebGPU」を活用しています。WebGPUはコンピュータグラフィックスの高速化のための新規格ですが、DNNにおける処理でも大幅なスピードアップがもたらされることがわかりました。

また、ほかのブラウザでも「WebAssemblbly」と呼ばれる新規格に対応することで、性能を有効活用できることもわかりました。

WebDNNと既存のソフトウェア「Keras.js」とで処理速度を比較したところ、WebDNNは約50倍の速度で計算できることが確認されました。

WebDNN

WebDNNを使った画像変換のデモページが公開されています(https://mil-tokyo.github.io/webdnn/ja/)。

デモでは、DNNを使った「画風変換」を実行します。このモデルは「Neural Style Transfer」と呼ばれるもので、コンテンツ画像とスタイル画像という2種類の画像から新しい画像を生成します。

上の画像が「コンテンツ画像」、下の画像が「スタイル画像」です。スタイル画像の「画風」がコンテンツ画像に適用されて、新しい画像が生成されます。

葛飾北斎が描いた富嶽三十六景の画風がコンテンツ画像に取り入れられ、新しいスタイルのバスの画像が生成されました。

このように、今回開発されたWebDNNを使うことで、ユーザーのパソコンやスマートフォンで簡単に最新のアプリケーションを試すことが可能になります。

また、WebDNNを使うことで、ディープニューラルネットワークを用いたWebサービスを低コストで提供することができます。ユーザーはWebサービスを提供するURLを開くだけで、アプリをインストールする必要がありません。

また、処理が端末内で完結するため、処理対象となる画像をサービス提供者に送信する必要がなく、プライバシー保護の点においても安全性が高いというメリットがあります。

IMAGE1SOURCE1
NEW POST