車載音声アシスタント評価ソリューション

AIの導入により、音声認識と画像認識、無線技術、音声データなどを組み合わせることにより、音声アシスタントは今後も発展していくと期待されています。

アリオンの車載音声アシスタント評価ソリューションでは、受信距離や受信角度、騒音干渉、音の特性、環境、気温など様々な要因をAIプラットフォームによりシミュレートでき、潜在的なリスクを特定します。

自動車購入者の約63%が音声アシスタントの存在が重要だと回答

米Voicebot.aiの2020年1月の調査では、自動車購入者の約63%が車載音声アシスタント機能を搭載してほしいと報告されており、車内音声アシスタントの自動車購入決定に対する影響はますます増加することが分かりました。

       図1:車内音声アシスタントの自動車購入決定に対する影響度

※出典:https://voicebot.ai/2020/02/25/over-60-of-car-buyers-that-have-used-voice-assistants-factor-availability-into-purchase-decision/

車載音声アシスタント機能のなかで最もよく利用されるユーザーシーンは「電話の受・送信」となり、続いて「カーナビおよびコントロール」、「メッセージの送受信」「音楽再生」「ラジオの利用」となります。未来の自動車では、車載音声アシスタントはAI同乗者として重要な役割を担うことと言っても言い過ぎではないでしょう。音声アシスタントの使用シーンがより複雑かつ多様化していることで、今後の品質確保には、単純に音声認識が正しくできるだけではなく、製品性能の向上や接続の安定性、ハードウェアとソフトウェアの整合性などといった課題が改善のポイントとなっています。

車載音声アシスタントの一連処理について

車載音声アシスタントの処理は、基本的には以下の三つで構成されています。

①前処理部

ハンドルの音声ボタンでウェイクアップさせたり、ウェイクワードによる音声アシスタント機能を呼び出す方法があり、そこから入力した音声は前処理部にてノイズキャンセル等の信号処理を行うことによって、環境における様々な音源(環境ノイズや音声コマンド以外のマルチボーカルなど)を分離し、入力音声を抽出します。

②自然言語理解

入力されたコマンドやクエリに対して、システムは自然言語理解プログラムで処理し、自然言語生成のプロセスでキーワードから該当するワードを検索して、文章生成を行います。

  1. 高精度音声認識(ASR):音声を高精度に認識する
  2. 自然言語理解プログラム:言葉や文章のもつ意味を認識、処理する

③学習識別

自然言語生成が行われる前に、ダイアログ管理ブロックで一度データの識別処理を担い、要求されたアクションがオフライン・オンラインのどちらの通信によるものかを判断し、経路をたどり処理・判定を行います。

例えば、天気情報を確認する場合には、ダイアログマネージャーの判断により基本的には車載製品の画面に認識処理後の情報を表示します。また、音声操作で窓を開ける場合には、音声返答に加え、窓を開けるという操作が生じるケースも発生することがあります。

ドライバーが運転中に失敗した操作を繰り返すことにより、事故を引き起こす危険性がある

ノイズ環境下で発生する事象を例に挙げると、

  1. 正しく音声認識されない問題
  2. Wake upできない、もしくは間違ってWake upされてしまう問題
  3. コマンドの間違った解釈および間違って応答する問題
  4. 機能的な問題
  5. 音声品質問題
  6. 応答の遅延問題

上記の問題は大きく3つの種類に分けられます。

音声が認識されない

車内環境では家庭内より多い各種騒音が想定されます。ドライバーが音声コマンドを入力する際に、同乗者の声や周囲の環境(走行中に生じるロードノイズ、雨音、落雷音、エンジン音、エアコン音など)、雑音音声(マルチボーカル、リバーブなど)が同時に生じることで音声の聞き取りがより困難になり、検知しづらくなる現象が発生します。

内容理解不能

前処理部の処理を経て、高精度音声認識機能でテキスト化された内容が、自然言語理解の言語モデルの観点で正常に理解されないことが要因となり、テキスト化された内容が誤変換され間違って解釈されます。

間違って解釈される例:

  • 質問:今日傘が必要?
    • [応答:理解できる場合] 傘は不要です。
    • [応答:理解できない場合] 明日の天気はどうですか?

誤返答もしくは無回答

車載音声アシスタントは娯楽サービスの提供や情報検索、オーディオ再生などに使われるほかに、車内から家庭内のスマートデバイスを遠隔操作するのにも使用されます。このような利用方法では、互換性の問題が多く生じます。

さらに、実際の利用シーンでは、天候、時間帯、走る場所、利用者などの利用環境が様々に異なるため、あらゆるシーンやノイズ要因を想定した試験が必要となります。

車載音声アシスタント利用時に誤解釈や無応答が生じると、ドライバーが同じ操作を繰り返すこととなり、もしこのような問題が運転中に繰り返し発生し、ドライバーの注意力が散漫になれば、事故の発生リスクとなります。

アリオンの車載音声アシスタント評価ソリューション

 ユーザーシナリオのシミュレーション 

  • 実際に起こりうる様々なノイズ音を録音
  • 上記ノイズ音と音声コマンドを合わせ、異なる環境下における言葉の検知性や反応性を含む精度の測定

 音声ライブラリの用意 

  • 性別、年齢、言語、方言などのバリエーションを含んだ12,000以上の音声コマンド
  • 状況に基づく音声コマンドのカスタマイズ

 車載音声アシスタント向けAIソリューション 

  • 運転手や同乗者などの、声に関するユーザーシナリオを想定した、ボイスライブラリーを用いた音声入力試験
  • 自動車利用時に発生する、シナリオと環境シーンのノイズを考慮した、目的発話音とノイズ音を組み合わせた試験
  • アリオンのAIテストエンジンを用いた視覚と聴覚的な自動認識を用いた自動判定試験

車載オーディオ品質評価をサポート 

アリオンは長年以上にわたる試験技術と、大手企業の製品を検証する実績を基づいて、AVSセルフテスト、CortanaセルフテストまたIntel Platformなど関連搭載製品向けの検証試験サービスを提供し、製品品質の向上をお手伝いします。

  • オーディオ品質評価:ITU-T / Apple CarPlay / Amazon Alexa
  • 相互接続性検証
  • 車載音声アシスタントAI評価ソリューション