NTTドコモ、走行中のドライバーの声から感情を認識するAIを開発

走行中の車内で雑音があるなかでも運転者の声から感情を認識できる人工知能(AI)を活用した技術をNTTドコモとEmpathが共同で開発しました。この技術を使って「AIインフォティメントサービス」の導入につなげることを目指すとしています。




今回開発した技術は、NTTドコモが独自にもつ音声感情認識技術と、Empathの音声感情解析AIに基づいて開発されました。

昨年11月から今年3月にかけて、両社は自動車の走行騒音がある環境下で、音声による感情推定の認識率の向上を目指す取り組みを実施しています。

音声感情認識のしくみ(NTTドコモ)

声の高さや音色など、対象となる音声のもつ音響的な特徴を分析して、あらかじめ機械学習によって生成した感情認識モデルを使ってどのような感情をもつ音声であるかを推定します。

走行時の自動車内ではエンジン音などの雑音があるため、これらの特徴を取り入れた認識モデルを生成する技術もまた使います。

停車中を想定した雑音が小さい条件や、高速道路を走行中を想定した雑音が大きい条件において、運転者によって自然に発声された音声から「怒り」「喜び」「悲しみ」といった感情を分析。その結果、平均の正答率は75%を達成しています。

また、AIが運転者の感情を理解して感情に合わせた「声かけ」を行うことで、運転に良好な影響を与えることができます。

カーシミュレータを使った実験(NTTドコモ)

実験では、乗車時の環境に近いシミュレータに音声アプリを設置。被験者の感情状態に合わせて用意された対話スクリプトを使ってアプリによる影響を計測しました。

対話スクリプトについては精神科医や臨床心理士などが監修を行いました。ポジティブ心理学や認知行動療法のメソッドを使ってスクリプトが作成されています。

実験の結果、アプリによる音声によって運転者の眠気やだるさなど、倦怠感を示す指標値は50%減少し、また被験者の93%はAIが自分の気持ちに寄り添ってくれていると感じ、気分よく運転できることがわかりました。

今回開発された技術は、NTTドコモが提供する自動車向けの音声エージェントサービスへ今年度中に導入することを目指しています。

NEW POST