
Nuance Gatekeeper 声紋認証ソリューション
Nuance Gatekeeper
声紋認証ソリューション
対話型AI HAL3 翻訳機能は、翻訳したい文章をマイクに向かって話すか、
翻訳したい文章の画像をカメラに認識させると、AIが認識して、
テキスト化し、画面に表示するとともに音声読み上げをおこなうサービスです。
言語ごとの通訳がいなくても海外との会議が可能になる。
翻訳したい文章をマイクに向けて話すか、翻訳したい文章の画像をカメラに認識させると、AIが認識して、テキスト化し、入力画面に表示する。翻訳エンジンがテキストを翻訳し、出力側画面に元テキストと翻訳されたテキストが表示され、同時にAIが音声合成をし、音声も併せて聞くことが出来る。翻訳に用いる翻訳エンジンは用途に合わせて変更可能である。テキスト・映像・音の3つのモーダルチャネルの技術を組み込んだAIとして翻訳機能を使うことが出来る。リモートでの使用のも対応している。
弊社開発対話型AI「HAL3」の翻訳機能はGoogle翻訳やポケトークといった代表的な翻訳機にも備わった音声入力、テキスト化といった機能に加え、禁止用語設定、専門用語設定が可能である。禁止用語設定機能は、ユーザが予め設定した単語は、テキスト化、音声化されないようにする機能であり、機密事項やいわゆる放送禁止用語のような不適切な表現といった用語が翻訳先の相手に誤って伝えられないようにすることが可能である。専門用語設定は、あらかじめ言語同士の対応を設定しておくと、単純な翻訳ではなく設定された単語に必ず翻訳するようにする機能であり、企業や業界内特有の特殊な用語にも対応でき、テキストを保存しておくことで議事録のような使い方も可能になる。
【翻訳可能な言語】
日本語 → 英語
英語 → 日本語
日本語 → 中国語
中国語 → 日本語
英語 → 中国語
中国語 → 英語
【組み込み可能なAI技術】
・雑音を除去するAI
・複数人が話している環境から特定の人物の音声を抽出するAI
・異なるマイクを使用しても同じような音声を出力できるAI
話しかけると、「HAL3」が翻訳したテキストを音声として出力する。話している人の顔を認識し、快・不快を判定することも可能である。例としては、外国人旅行客の顔の表情から迷っていて不安なのか、旅行は楽しそうなのかなどを推定することができる。
当社は求められているAIを何もないところから新たに開発し、製品として提供するサービスを行っている企業である。今回の製品は自動車メーカーからの要望により研究開発するに至った。自動車メーカーは世界中に多くの工場があり、工場同士の会議が頻繁に行われる。HAL3を導入することで、言語ごとの通訳がいなくても海外との会議が可能になる。専門分野に精通した通訳の相場は1日当たり10万円前後であり、20社あるとすると1日に200万円必要な計算になる。
また一般的な通訳は、話者が区切りの良いところまで話し、通訳者がそこまでの話を訳す、の繰り返しで話すのが話者であれ通訳者であれ、一度に話をするのはどちらか片方だけになるので会議に時間がかかる。HAL3の翻訳は、翻訳されたテキストを読み上げている間にも次の音声入力が可能なためスムーズな会議が可能になる。HAL3の導入によって、通訳を雇う費用が削減できるほか、企業で実際に活用されることを想定し禁止用語や専門用語を設定できる機能を設けることで、社内機密を第三者に伝えることなく、また、専門用語への対応も可能になる。
このようなオンラインでのビデオ通話や会議の需要は今まさに高まっている時期だと考える。その際に円滑なテレビ会議が行われなければ、リモートワークの重要性は軽視されてしまう。人の声のみを聴きやすくしたりする弊社の技術で、さらに使いやすい機能として社会に還元できるのではないかと考えた。
当社は小さな企業であるが、そのおかげで即断や細やかな対応・スピード感をもった研究開発が行えるという強みがある。きっかけは製造業を行う企業からの依頼で開発した製品であるが、今後製造業だけでなく様々な業界・人々の生活に役立つ製品としてさらに成長させていきたいと考えております。
対話型AI HAL3 翻訳機能は、翻訳したい文章をマイクに向かって話すか、翻訳したい文章の画像をカメラに認識させると、AIが認識して、テキスト化し、画面に表示するとともに音声読み上げをおこなうサービスです。
AI製品・ソリューションの掲載を
希望される企業様はこちら