生成AI

AIエージェント
生成AI
ChatGPT連携サービス
AI受託開発
対話型AI -Conversational AI-
ボイスボット
バーチャルヒューマン
教師データ作成
AI研究開発
通訳・翻訳
声紋認証
機密情報共有・管理
契約書管理システム
ワークステーション
FAQシステム
AIカメラ
生体認証
インボイス制度対応システム
データセットの収集・購入
コールセンター
人事・総務向け
インバウンド対策
コンバージョンアップ
KYT・危険予知で労働災害防止
無料AI活用
顧客リスト自動生成
ロボットで自動化
LINE連携
セキュリティー強化
テレワーク導入
AI学習データ作成
配送ルート最適化
非接触AI
受付をAIで自動化、効率化
AIリテラシーの向上サービス
日本語の手書き文字対応AI-OCR
Windows作業の自動化RPAツール
リスク分析AIで与信管理
紙帳票仕分けAI-OCRサービス
サプライチェーン
AIコンサルティング
最終更新日:2024/04/09
近年は広範な分野で、さまざまな種類のAIが活用され、人手不足を補ったりサービス品質を向上したりする事例が増えています。将来的には、必要不可欠な技術として、より身近な存在として扱われることが予測されます。
そのような中で、音声の感情認識AIに注目が集まっているのをご存知でしょうか。コールセンターでのクレーム解析、従業員のストレスチェックなど、さまざまな業務課題を解決すべく導入され始めているのです。
そこで今回は、音声の感情認識AIの特徴や活用事例を詳しくご紹介していきますので、ぜひ参考にしてみてください。
AIソリューションについて詳しく知りたい方は以下の記事もご覧ください。
AIソリューションの種類と事例を一覧に比較・紹介!

感情認識(感情分析)とは、人間の感情や気持ちの変化、表情などを読み取ることを指します。つまり「感情認識AI」は、それらを行うことができるAIと言えるわけです。
分析の対象は顔の表情や声、文章など、多岐に渡り、「音声の感情認識AI」は文字通り「音声」を分析することによって、人間の感情や表情などを読み取っていきます。これまで、人間の感情を把握・分析するのは、およそ人間にしかできないものだと考えられていました。稀に人間の生活に深く関わるペットなどは、人間の感情の一部を理解できると考えられていますが、まだ研究段階となり、はっきりとは分かっていない状況です。
そして当然ながら、コンピューターなどの機械も人間の感情は理解できないため、人間がどのような感情で接しても同じレスポンスになっていました。しかし、近年はAIの技術が発展したことによって、人間の感情をも分析できるようになってきています。そのため、「機械も人間の感情や気持ちを汲み取った上で個別の対応を行う」ということが実現され始めているのです。
このようなAIの技術は、接客が必要となるサービス業やマーケティングなどにおいて特に重宝されるものとして、期待が寄せられています。
「声の感情認識AI」は、日本語や英語といった特定の言語に依存せず、「声の抑揚」や「声の大きさ」といった物理的特徴量の分析によって、感情を認識するという仕組みのAIです。
音声によって人間の感情を判定できるようになれば、声だけでコミュニケーションを図る必要があるコールセンターでも、ユーザーがどのような感情なのかを知ることができます。もちろん、オペレーター側のストレスチェックなどにも活用することが可能です。
また、ロボットやバーチャルアシスタントが「声の感情認識AI」を搭載すれば、人間同士のコミュニケーションのように円滑なやり取りを行えるようになるでしょう。
最近では、さまざまな企業が音声の感情認識AIを開発・提供するようになりました。ここからは、代表的な音声の感情認識AI企業について、詳しく見ていきましょう。
株式会社Empathでは、音声から気分状態を可視化するAI・人工知能エンジンの開発・提供を行っています。音声等の物理的な特徴量から気分の状態を独自のアルゴリズムで判定するプログラムは、Empathの大きな特徴と言えるでしょう。
株式会社Empathが提供している感情認識AI「Empath」は、音声等の物理的な特徴量から気分の状態を独自のアルゴリズムで判定するプログラムです。数万人の音声データベースを元に喜怒哀楽や気分の浮き沈みを判定します。 Web API化によって、JavaScriptコードを、Webサイト上に埋め込むだけで簡単に感情解析技術を導入可能です。
また、APIのURLにWAVEファイルを送るプログラムをご用意いただければ、Linux、Windows、iOS、Android OS等、プラットフォームを問わずに導入できます。M2M、IoTのセンサーとしても気軽に利用できる点も、大きな魅力と言えるでしょう。
東京都港区に本社を置く株式会社ユーザーローカルでは、ディープラーニングを活用して音声から感情認識を行う「音声感情認識AI」というサービスを提供しています。マイクが搭載されたPC端末からWebブラウザ(Google Chrome、FireFox、Edge)でページにアクセスし、声を録音するだけで簡単に利用することが可能です。
マイクから音声を直接入力するだけでなく、事前に用意しておいた音声ファイル(WAV・MP3)をアップロードする形でも利用できます。大量の音声データを学習したAIが自動で「平穏」「幸福」「怒り」「悲しみ」「恐怖」「嫌悪」「驚き」という7つの感情に分類し、それぞれの感情についてグラフ化したり数値化したりできるという仕組みです。
NTTドコモでは、Empathと共同で雑音環境での音声感情認識技術を開発し、自動車向けの音声エージェントサービス「AIインフォテイメントサービス」に導入しました。この技術は、NTTグループが開発したAIの「corevo」を構成するドコモ独自の音声感情認識技術と、Empathが有する音声感情解析AI「Empath」の技術を掛け合わせて開発されたものです。
特徴としては、認識対象となる音声に対して、「声の高さ」「音色」といった特徴の分析を行い、事前に生成した感情認識モデルを活用することによって、音響の特徴から感情を予測していく点が挙げられるでしょう。
株式会社スワローインキュベートでは、パナソニック株式会社の特許技術を活用した「音声感情認識AI」を開発しており、この音声感情認識AIを活用した「SDK(ソフトウェア開発キット)」「Web API」などの提供も行っています。また、ホームページ上で手軽に精度の検証を行えるトライアルWebアプリも提供されているため、誰でも気軽に感情認識AIの技術に触れることが可能です。
さらにスワローインキュベートでは、「UDトーク」というアプリに感情認識SDKを提供したことでも注目を集めています。UDトークの特徴としては、以下のような点が挙げられます。
音声自体の持つ特徴量をベースとした「音響解析型」で、最大70パーセント程度の認識率で感情を判定します。また、感情成分の解析も可能です。固有名詞などに左右されないため、従来の言語解析型では判定が困難だった会話や音声の判定も行います。
音声自体の持つ特徴量を分析することで、クレームなどの感情が検知されます。また、個人によって受け取り方や捉え方が異なっていた部分が可視化されます。
人の会話や発話音声の特徴量で判定するため、多言語対応が可能です。UDトークは、iPhoneやiPadで会話を音声認識し、会話の内容をリアルタイムでテキスト化します。スワローインキュベートの感情認識SDKをUDトークに搭載することで、会話のやりとりだけでなく、感情の度合いもリアルタイムで表示されるようになります。
株式会社AGIでも、声から感情を認識する技術の研究・開発を行っています。AGIが提供しているソフトウェア開発キット「ST Emotion SDK」を活用すれば、音声分析によって感情を色で可視化したり、10段階でスコア化したりすることがかのうです。
色で可視化する場合には、喜びは黄色、怒りは赤色、悲しみは青色、平常は緑色といった形で表示されます。分析は、発話単位でリアルタイムに行われるため、より細かな分析を行いたい企業にも最適と言えるでしょう。
音声の感情認識AIは、さまざまな業界で活用され始めています。実際にどのような場所で音声の感情認識が活用されているのか、その事例を詳しく見ていきましょう。

音声から感情を分析するAIは、日本語や英語といった特定の言語に依存せず、「声の抑揚」や「声の大きさ」といった物理的特徴量の分析によって、感情を認識するという仕組みです。
音声によって人間の感情を判定できるようになれば、声だけでコミュニケーションを図る必要があるコールセンターでも、ユーザーがどのような感情なのかを知ることができます。ユーザーの感情をいち早く察知することで、クレームに発展してしまう前の段階で対処することも可能になるのです。
また、ロボットやバーチャルアシスタントが声の感情認識AIを搭載すれば、人間同士のコミュニケーションのように円滑なやり取りを行えるようになるというメリットもあります。

接客やクレーム対応など、顧客とのコミュニケーションが日常的に発生する業種においては、コミュニケーションの面で精神的負担が大きくなるケースも少なくありません。その精神的負担を軽くするための対策がなければ、離職率の増加を招いてしまう可能性もあるわけです。
そのため、最近では音声の感情認識AIによってオペレーターの声から感情分析を行う企業が多くなってきています。オペレーターの声から精神状態を判定し、一人ひとりの感情を把握できるようになれば、より最適なフォローを行うことが可能になるからです。
オペレーターごとに抱えている悩みや不安は異なるため、一人ひとりに最適な指導を行っていく上でも音声の感情認識AIが果たす役割は大きいでしょう。
今回は、音声の感情認識AIの仕組みや活用事例について詳しくご紹介しました。最近ではさまざまな企業が積極的に感情認識AIの開発・提供を開始しており、それぞれ異なる特徴を持っていることがお分かりいただけたのではないでしょうか。
近年は人手不足が深刻化しているため、いかにAIを有効活用して業務効率化や生産性向上に繋げられるかが、企業の将来を左右すると言っても過言ではないでしょう。感情認識は、音声以外にもテキストや生体情報、動画などさまざまな種類が存在しますので、ぜひこの機会に最適な感情認識AIの導入を検討してみてはいかがでしょうか。
ちなみに、AIsmileyでは感情認識AIカオスマップや感情認識AI比較資料を無料でお配りしています。感情認識AIの導入をご検討の際は、ぜひ以下のページからお気軽にお問い合わせください。
AIについて詳しく知りたい方は以下の記事もご覧ください。
AI・人工知能とは?定義・歴史・種類・仕組みから事例まで徹底解説
業務の課題解決に繋がる最新DX・情報をお届けいたします。
メールマガジンの配信をご希望の方は、下記フォームよりご登録ください。登録無料です。
AI製品・ソリューションの掲載を
希望される企業様はこちら