ニューラル機械翻訳の精度が大幅アップ、無料の音声翻訳アプリ「VoiceTra」に実装

深層学習を利用した機械翻訳の実用技術を情報通信研究機構が開発しました。日英の双方向での話し言葉の翻訳を対象に、9割前後と非常に高い翻訳精度を達成しています。




近年はさまざまな国からの旅行者が観光で日本を訪れており、2020年の訪日観光客は4千万人を突破するとされています。

そのため、多言語に対応した音声の翻訳はますますニーズが拡大していくと考えられます。

ルールベース翻訳からニューラル機械翻訳へ

これまで、自動翻訳の研究開発は「ルールベース翻訳(RBMT)」が主流となって進められてきました。しかしながら、文法規則と辞書に基づいて開発されるRBMTでは精度の改善が頭打ちとなり、代わりに「対訳コーパス」に基づいた「統計翻訳(SMT)」が成長を遂げます。

対訳コーパスとは、異なる言語で書かれた文について対訳の形でまとめられたもので、SMTでは対訳コーパスを用いて統計的に自動翻訳のシステムが構築されました。

さらに近年では、SMTと同様に対訳コーパスを用いてニューラルネットワークを活用した自動翻訳技術である「ニューラル機械翻訳(NMT)」の研究が進められており、SMTよりも精度の高い翻訳が実現できるようになってきています。

ニューラル機械翻訳の精度向上

情報通信研究機構では、ニューラル機械翻訳の研究を2013年に開始しており、実用化を加速させています。

実用化には、多様な分野における対話で使用される固有名詞や専門用語の辞書を追加していくことが必要です。そこで研究グループは、単語と訳語、およびその意味分類を利用する手法を機械翻訳に実装しました。

その結果、翻訳精度が大幅に改善され、多くの分野で9割前後の高精度を達成することに成功しました。

また、すでに公開されている多言語音声翻訳アプリ「VoiceTra(ボイストラ)」に対してもニューラル機械翻訳の技術を組み込んでおり、精度が改善されたことを体験できるとしています。

今後は日英のみならず、中国後や韓国語、タイ語、インドネシア語、ベトナム語、ミャンマー語、スペイン語、フランス語についても対応するよう拡大を進めていくとしています。

  • VoiceTRa:直接話しかけることで外国語に翻訳してくれる多言語音声翻訳アプリ。翻訳可能な言語は31言語で、そのうち21言語は音声による入力が可能。また、16言語は音声出力も可能。ダウンロードして無料で利用できる。
IMAGE1SOURCE1
NEW POST