生成AI

              
            
                                                            AIエージェント                            
                            
                            
                                                            生成AI                            
                                                          
                            
                            
                                                            ChatGPT連携サービス                            
                                                          
                            
                            
                                                            AI受託開発                            
                            
                            
                                                            対話型AI -Conversational AI-                            
                            
                            
                                                            ボイスボット                            
                            
                            
                                                            バーチャルヒューマン                            
                            
                            
                                                            教師データ作成                            
                            
                            
                                                            AI研究開発                            
                            
                            
                                                            通訳・翻訳                            
                            
                            
                                                            声紋認証                            
                            
                            
                                                            機密情報共有・管理                            
                            
                            
                                                            契約書管理システム                            
                            
                            
                                                            ワークステーション                            
                            
                            
                                                            FAQシステム                            
                            
                            
                                                            AIカメラ                            
                            
                            
                                                            生体認証                            
                            
                            
                                                            インボイス制度対応システム                            
                            
                            
                                                            データセットの収集・購入                            
                            
                            
                                                            コールセンター                            
                            
                            
                                                            人事・総務向け                            
                            
                            
                                                            インバウンド対策                            
                            
                            
                                                            コンバージョンアップ                            
                            
                            
                                                            KYT・危険予知で労働災害防止                            
                            
                            
                                                            無料AI活用                            
                            
                            
                                                            顧客リスト自動生成                            
                            
                            
                                                            ロボットで自動化                            
                            
                            
                                                            LINE連携                            
                            
                            
                                                            セキュリティー強化                            
                            
                            
                                                            テレワーク導入                            
                            
                            
                                                            AI学習データ作成                            
                            
                            
                                                            配送ルート最適化                            
                            
                            
                                                            非接触AI                            
                            
                            
                                                            受付をAIで自動化、効率化                            
                            
                            
                                                            AIリテラシーの向上サービス                            
                            
                            
                                                            日本語の手書き文字対応AI-OCR                            
                            
                            
                                                            Windows作業の自動化RPAツール                            
                            
                            
                                                            リスク分析AIで与信管理                            
                            
                            
                                                            紙帳票仕分けAI-OCRサービス                            
                            
                            
                                                            サプライチェーン                            
                            
                            
                                                            AIコンサルティング                            
                            
                            最終更新日:2025/01/20
                                  音声認識とは?
                                              第三次AIブームと呼ばれる昨今、さまざまな分野でAI・人工知能が導入され始めています。サービスの品質向上や業務効率化など、数多くのメリットをもたらす存在であるため、多くの企業に注目されているのです。
そのような中で、AIを活用した音声認識にも大きな注目が集まっているのをご存知でしょうか。人の声を認識するAI技術を活用すれば、さまざまなことを実現でき、さらなる品質向上や業務効率化などが期待できます。
今回は、この「音声認識」の特徴や仕組み、歴史などを詳しく解説していくとともに、音声認識AIの導入事例をご紹介していきますので、ぜひ参考にしてみてください。
AIソリューションについて詳しく知りたい方は以下の記事もご覧ください。
AIソリューションの種類と事例を一覧に比較・紹介!

音声認識とは、人が発言した内容を解析し、音声データをテキストに変換する技術のことです。身近な例としては、スマートフォンの音声入力機能(SiriやGoogleアシスタント)などに搭載されています。音声認識では、発話内容に対して機械的な解析を行うことになります。そのため、日常会話のなかに含まれる曖昧な表現まではすべて理解できないケースもあります。
したがって、自然な日常会話をコンピューターが理解できるように処理する技術である自然言語処理と併せて用いられていることが一般的です。つまり、音声認識を実践で導入するためには、音声認識と自然言語処理の両方の能力が必要ということです。

音声認識システムの主な仕組みは、以下の流れのようになります。
| 過程 | 概要 | |
| 1 | 音声分析 | 人間が発言した内容をコンピューターが理解しやすい音声データ形式に変換する | 
| 2 | 音響モデル | 音声データから音素(母音や子音などの音の区切り)を抽出する | 
| 3 | 発音辞書 | 抽出した音素とデータベースに登録されている単語を紐づける | 
| 4 | 言語モデル | 発音辞書で特定した単語を組み合わせて文章を作成し、テキスト出力を行う | 
上記の流れのように、まずは元の音声をコンピューターが理解できる音声データに変換したうえで、音声データを音素に分解します。そして、音素から単語を特定し、最後に単語同士をつなげて文章を作成する流れがおおまかな仕組みです。
近年ではディープラーニングの登場によって、音声認識に以下のような変化が起こりました。
ディープラーニングと音声認識を組み合わせることで、音声だけでアプリケーションの起動から終了まで一連の命令を出せるようになりました。また、周囲のノイズを除去し、より正確に音声を聞き取れるようになったことも大きな変化です。
音声認識を導入するメリットは以下の通りです。
AI音声認識を活用することで、音声データの自動文字起こしが可能になります。会議や面談の内容を手動で書き起こす作業は非常に時間がかかりますが、AI音声認識を用いれば短時間で正確な文字起こしができます。これにより、従業員は本来の業務に集中でき、生産性の向上につながります。
人手による文字起こしでは、聞き漏らしやタイプミスが発生する可能性があります。一方、AI音声認識は高い精度で文字起こしを行うため、ミスが減少し、業務の正確性が向上します。
コールセンターなどでAI音声認識を導入することで、顧客とのやり取りをリアルタイムで文字化し、適切な対応を素早く行うことができます。また、通話内容を分析することで、顧客の満足度や問題点を把握し、サービス改善に役立てることができます。これにより、顧客満足度の向上と長期的な関係構築が期待できます。
音声認識は、スマートスピーカーや自動応答サービスなどで利用が広がり、業務や日常生活の効率化に大きく貢献しています。
しかし、導入にあたって注意すべき課題もいくつか存在します。ここでは、特に問題なりがちな「方言の認識が苦手」「テキストでの発話者の識別ができない」という二つの点についてご説明いたします。
音声認識の多くは標準語を前提に開発されているため、地域特有の発音や言い回しをうまく理解できないことがありあります。標準語であれば精度が高くても、方言が混じると、誤変換が多発し、ユーザーの利便性が低下しがちです。
さらに、方言データを収集・学習させるためにはコストもかかり、言葉が変化し続けるという現実も踏まえると、常に最新の発話パターンを反映するのは容易ではありません。
会議やインタビューの音声を文字起こしする際、複数の人が話す内容が混在すると、誰の発言なのかを自動的に区別するのは難しくなります。
発話者を特定する技術を組み込んでいても、完全自動化は困難で、人手による修正が必要になる場合も多いです。そのため、音声認識を導入しても、作業効率が思ったほど向上しない可能性があります。
これらの課題を考慮しつつ、実際の導入環境や利用目的に合わせて最適な方法を検討することが重要です。特に方言対応と話者識別の問題は、音声認識の便利さを損ねる要因となりやすいため、十分な事前検討と運用設計が求められます。
ここでは、音声認識の活用場面として以下の活用例を紹介します。
音声認識によって、議事録作成や文字起こしなどの作業効率化が図れるとともに、多言語間での通訳・翻訳などもスムーズに行えるようになります。
音声認識を活用して会議や打合せでの会話データをテキスト化することで、議事録の自動作成が可能になります。社内会議などが多く、議事録を作成する機会が多い部署にとっては、業務効率化に大きく貢献する活用例です。
また、社員が議事録を作成する場合、各社員の知識量や経験によって議事録の品質や作成スピードにばらつきが生じてしまいます。議事録の品質や作成スピードに問題がある場合、正確かつスムーズな情報共有に支障をきたしてしまう可能性があります。それに対し、音声認識を活用した議事録の自動作成であれば、担当者の知識量や経験によらず一定品質の議事録をタイムリーに作成できます。
音声データなどからの文字起こしも音声認識の主な活用例です。たとえば、社外で取引先などと商談を行う際に商談中の会話を録音しておき、会社に帰ってから録音データを使って文字起こしを行う活用方法などが挙げられます。音声認識を使って録音データから文字起こしを行うことで、担当者の記憶に頼らず商談中の会話を確実にテキスト化することが可能です。
また、コールセンターなどで顧客からの問い合わせ電話の内容を文字起こしする活用例もあります。電話対応中に音声データをタイムリーにテキスト化することで、問い合わせ内容の記録や対応品質の向上などにも役立ちます。
音声認識の活用例として、多言語間の通訳・翻訳もあります。たとえば、ポケトークなどの音声翻訳機が有名な事例です。音声翻訳機を活用することで、国際的な会議や商談の場面でもスムーズに会話のやり取りを行うことが可能です。
これまで通訳者の同席が必須であった会議でも、音声翻訳機を活用することで通訳が不要になるケースも生まれます。それにより、人件費の削減やスケジュールの円滑化などのメリットも期待できます。
会議や商談の場面以外でも、外国人観光客とコミュニケーションを取る場面や海外出張の場面などでも活用できると考えられます。
音声認識を活用することで、音声だけで機器の起動や操作も可能になります。たとえば、Amazonが開発した「アレクサ」などのスマートスピーカーが有名な事例です。スマートスピーカーに音声で話しかけるだけで、手を使わなくても部屋の電気を付けたり、エアコンのスイッチを入れたりすることが可能です。また、音楽再生や電子書籍の読み上げなどもできます。
このような音声認識の技術は、プライベート利用だけでなくビジネスの場面でも活用できます。たとえば、工場に音声認識の技術を導入することで、音声による指示だけで複数台の機器操作なども可能です。
音声認識の活用により、コンピューターとの会話を行うこともできます。たとえば、スマートフォンに搭載されているSiriやGoogleアシスタントなどの音声入力機能が有名な事例です。SiriやGoogleアシスタントを使うことで、ハンズフリーで情報検索をしたり、コンピューターとの会話を楽しんだりできます。
また、近年では企業のWebサイトなどにチャットボットが搭載されていることも多く、音声認識を使った問い合わせができるケースも出てきています。今後も音声認識の技術の発展によって、さまざまな場面でコンピューターとの会話ができるようになり、さらに生活が便利になっていくと考えられます。
最近では音声に加え、相手の感情も読み取ることができる感情認識AIというものが多く活用され始めています。この感情認識AIを活用すれば、商品に対して顧客がどのような感情を抱いているのか、より明確に知ることができるようになるのです。そのデータをマーケティングに活用すれば、販売促進の精度改善につなげていくこともできます。
もちろん、感情認識AIを活用する場合には、顧客の感情が反映されるデータを準備しなくてはなりませんので、コールセンターの通話記録やサイト上のユーザーレビューなど、分析のために必要となるデータが必要となります。しかし、これらのデータを用意することができれば、感情認識AIはすぐに活用できるようになるため、よりビジネス上の意思決定も効果的に行えるようになります。音声認識AIと組み合わせることで、通話記録など必要なデータを効率的に収集することが可能です。
近年は、さまざまな業界で音声認識AIが導入され始めており、業務効率化やサービス品質向上といった結果につなげています。では、具体的にどのような業界で音声認識AIが導入されているのでしょうか。ここからは、音声認識AIの導入事例について詳しく見ていきましょう。

(参照:“コールセンターに音声認識”で時短とコスト削減を レオパレス21が導入へ – ITmedia エンタープライズ)
不動産開発事業や賃貸事業を行うレオパレス21では、全国5カ所の拠点にコールセンターを運営しています。同社のコールセンターに導入されているのが、音声認識ソリューションの「AmiVoice Communication Suite3(アミボイス コミュニケーション スイート スリー)」です。この音声認識ソリューションの導入によって、AI技術を活用したFAQ機能などの活用が可能になっています。質問に応じて適切な画面を表示させることができるため、応対するオペレーターはスムーズに案内を行うことができるのです。
また、通話はすべてテキストで保存されるため、書き起こしの時間を大幅に削減することもできます。テキストデータの分析によってクレーム内容の確認作業や評価診断などが大幅に軽減されるため、業務効率化にも大きく貢献できているといえます。レオパレス21では、この音声認識ソリューションの導入によって年間約2,633時間の作業時間削減、そして約460万円のコスト削減が可能になるとしています。
AmiVoice Communication Suite3について詳しく見る

(参照:台車の異常を空気バネや振動、音で検知…『のぞみ』台車亀裂を受けたJR西日本の安全性向上策 | レスポンス)
JR西日本では、AIを活用して新幹線の走行音から異常を検知するシステムを開発しています。開発のきっかけは、2017年12月にJR西日本の山陽新幹線のぞみの台車が破断寸前のまま運行を続けた問題です。
台車の亀裂は破断寸前になっており、国の運輸安全委員会から新幹線では初となる「重大インシデント」と認定されたことでも知られています。
こういった「音」による異常検知は、人間の力だけで行っていくのは困難です。しかし、JR西日本のように過去の走行音をAIに学習させていけば、過去の「正常音」との比較を高い精度で行えるようになるため、より確実に異常を検知していくことが可能です。

(参照:茨城県庁、音声認識で議事録を自動作成するクラウドサービス「ProVoXT」を全庁で導入 | IT Leaders)
音声認識技術のエキスパートであるアドバンスド・メディアは、議事録作成のクラウドサービス「ProVoXT(プロボクスト)」を提供しています。茨城県庁では、「ProVoXT」を導入し、会議の議事録作成の効率化を実現しています。
自治体では、住民に公開するための議事録作成は大切な業務のひとつですが、多くの作業時間を必要とする問題がありました。「ProVoXT」はICレコーダーなどで録音した会議の音声をインターネット経由でアップロードすると、内容が文字化されるサービスです。数時間の録音データも十数分で文字データに起こすことができ、人の手による議事録作成と比較すると50%から70%の作業時間短縮が可能です。
また、アップロードした音声の認識結果は音声データと紐付けされているため、誤認識の検知・修正を行えます。また、大事な発言だけを抜粋したいというニーズにも対応でき、導入の成果を挙げています
「ProVoXT」によって作業時間が大幅に短縮されたことで、職員は議事録作成に充てていた時間を他の業務に活用できています。
音声認識ソフトは様々な種類があるため、導入を検討する際には、自社の目的や環境に適した製品を見極めることが大切です。ここでは、選定時に注目したい観点として、以下の5つを紹介します。
まずは、音声認識ソフトの精度と対応言語を確認します。環境雑音や話者の個人差、訛りやイントネーションにどれだけ対応できるかが重要です。
また、多言語対応が必要な場合は、日本語以外の言語の認識精度や切り替えの容易さも比較検討する必要があります。
音声認識ソフトは、あらかじめ登録されている単語の中から最適な候補を選択します。単語数が多いほどの認識の精度が高まり、自然な文章になりやすいのが特徴です。専門用語や固有名詞を多用する業種の場合は、専用辞書やカスタマイズ機能が充実している製品を選ぶと安心です。
操作が難しいと、せっかく導入しても従業員が使いこなせず、かえって効率が落ちてしまう可能性があります。実際にトライアルを使って操作性を確認し、社内で問題なく使えるかどうかを事前にチェックしておくと安心です。
音声認識ソフトが扱うデータには、機密情報や個人情報が含まれる可能性があります。そのため、セキュリティやプライバシー保護の観点を重視する必要があります。
クラウド型の場合は、データセンターの所在地や暗号化の有無を確認し、オンプレミス型の場合は社内での保護措置を徹底する必要があります。また、企業や業種によっては、特定のコンプライアンス要件に準拠する必要があるため、ソフトがそれらの要件を満たしているかも確認します。
音声認識ソフトには、単なる文字機能以外にも、句読点の自動挿入や翻訳・要約機能との連携など、多様な機能が備わっています。作業効率を向上させるためには、これらの機能が充実しているかも確認する必要があります。
さらに、既存システムや独自のワークフローと連携させるためには、APIやプラグインが利用可能かどうかも重要なポイントです。開発者向けのドキュメントやサポート体制が整っている製品を選ぶことで、導入後の運用がスムーズになります。
ここまでは、音声認識の仕組みやメリット、導入事例などについて詳しくご紹介してきました。では、実際に音声認識の利用を検討していく場合、どのようなアプリ・製品を選択すれば良いのでしょうか。現在はさまざまなアプリや製品が存在しますので、まずは代表的な無料アプリからご紹介していきます。

(参照:Google ドキュメント – オンラインでドキュメントを作成、編集できる無料サービス)
無料で利用することができる音声認識アプリの代表格として挙げられるのが、Googleドキュメントです。エディタが固定されてしまうという点はデメリットといえますが、Googleの音声認識エンジンは非常に優秀なので、最もおすすめできる無料アプリといえます。ちなみにスマホアプリ版では、メニューから音声を入力するのではなく、ソフトウェアキーボード(IME)から音声を入力する形式となっています。
普段からGoogle ドキュメントを使ってドキュメントの作成や編集を行っている人にとっては、Google ドキュメントの音声認識はおすすめのアプリです。
| 主な機能 | 音声入力機能、音声入力中の修正機能など | 
| 対応言語 | 日本語、英語、中国語などの各言語に対応 | 
| サポート | Chrome、Firefox、Edge、Safari | 

(参照:VoiceNote II – Speech to text – Chrome ウェブストア)
Voicenote IIは、他のエディタで音声認識機能を使用したいときにおすすめのアプリです。Google Chromeにアドオンとして追加可能なので、ブラウザで操作することができるオンラインテキストエディタであれば、音声入力対応にすることができます。
また、ブラウザで利用できるWebアプリ版が用意されているのも魅力のひとつです。Voicenote IIは、エディタを固定されずに音声認識機能を利用したい人におすすめできるアプリです。
| 主な機能 | 辞書登録機能、ファイル保存機能など | 
| 対応言語 | 日本語、英語、中国語などの各言語に対応 | 
| サポート | Google Chromeのアドオンとして各種ブラウザに対応 | 

(参照:だるーいときには、Simejiの音声入力)
Simejiは、AppleとGoogle以外のサードパーティ製カスタムキーボードとして高い知名度を誇るアプリです。実際にきせかえキーボードアプリとして利用されている方も多いのではないでしょうか。実は、このSimejiでも音声認識を利用することができるのです。そんなSimejiの大きな特徴としては、句読点や顔文字、そして絵文字なども自動で付くという点が挙げられます。
Simejiは、キーボードやボタンの背景を自分好みにデザインしたい人などにおすすめのアプリです。
| 主な機能 | 顔文字機能、キーボードの背景画像の変更機能、辞書機能など | 
| 対応言語 | 日本語、英語、中国語などの各言語に対応 | 
| サポート | Android、iOS | 

(参照:Edivoice – 音声入力で手軽に文章作成 マッシュルーム対応 – Google Play のアプリ)
Edivoiceは、Googleの音声認識システムを利用したAndroid専用の音声認識アプリです。このEdivoiceの特徴としては、句読点や改行を音声入力で行える点が挙げられます。多くのアプリは、句読点や改行を手入力で行わなければなりませんが、Edivoiceはそれらの作業も音声入力で行うことができます。先ほどご紹介したSimejiのように、喋り終わると自動で句点が入力されるよう設定することも可能です。
Edivoiceは、句読点や改行も含めて音声入力を行い、スムーズに文章を完成させたい人におすすめのアプリです。
| 主な機能 | 句読点・改行の音声入力機能、辞書登録機能など | 
| 対応言語 | 日本語、英語 | 
| サポート | Android | 

(参照:Speechnotes スピーチノート – 音声から文字へ – Google Play のアプリ)
Speechnotesも、Edivoiceと同じくGoogleの音声認識システムを利用したAndroid専用の音声認識アプリです。句読点や改行がボタンになっているため、音声入力を止めることなくスムーズに句読点や改行を挿入することができます。
また、Speechnotesには有料版も設けられており、有料版ではカスタムキーを使用して定型文をワンタップ入力することが可能です。画面を見ながら音声入力とタップを同時に使いたい場合に向いています。
Speechnotesは、音声入力と句読点・改行・定型文のタップ入力を併用したい人におすすめのアプリです。
| 主な機能 | 句読点・改行のボタン入力機能、Bluetooth対応機能など | 
| 対応言語 | 日本語、英語、中国語などの各言語に対応 | 
| サポート | Android | 

(参照:「音声をテキストに変換する – Speechy Lite」をApp Storeで)
Speechy Liteは、88以上の言語に対応しているiPhone専用の音声認識メモアプリです。無料版と有料版の2種類が用意されており、無料版では時間制限などが設けられています。ただ、さまざまなアプリにワンタップでテキストを送信することができるため、SNSなどでメッセージを作成する際に役立ちます。
また、大人数での音声認識モードも搭載されているため、さまざまな国籍の人々が集まる会議や打ち合わせにおいても重宝するかもしれません。Speechy Liteは、多国籍な参加者を集めたグローバル会議を行う機会の多い人などにとっておすすめのアプリです。
| 主な機能 | ワンタップでのテキスト送信機能、大人数での音声認識モードなど | 
| 対応言語 | 日本語、英語、中国語などの各言語に対応 | 
| サポート | iPhone | 
上記では音声認識アプリをご紹介しましたが、無料プランや無料トライアルが設けられているAI音声認識製品も多く存在します。ここからは、いくつか代表的なAI音声認識製品の特徴をご紹介していきますので、ぜひ比較検討の参考にしてみてください。

参照:株式会社十印 T-tact AN-ZIN®(ティータクト アンジン)
株式会社十印が提供しているT-tact AN-ZIN®(ティータクト アンジン)は、国家プロジェクトでつくられた高精度翻訳エンジンを搭載するAI翻訳ツールです。簡単便利に翻訳に関わる業務を効率化できるのが大きな特徴といえます。
また、高精度な翻訳によって海外の情報収集が手早くできるため、業務上の決断や、戦略立案をスピード化したい企業にも最適なツールといえます。ユーザー数無制限で文字数課金がないので、海外とのメールや、契約書の確認などを社員全員が自分で対応できるようになり、これまで対応していたグローバル社員は自身の業務に集中できるようになります。
ちなみに、T-tact AN-ZIN®に搭載されているAI翻訳エンジンは、国立研究開発法人 情報通信研究機構(NICT)が提供しているものです。NICTのAI翻訳エンジンは総務省と進めている「翻訳バンク」で蓄積された質の良い大量の対訳データから作成されており、TOEIC960点相当の実力を持っています。さらに、特許庁の協力で作られた、高精度の特許専用エンジン・特許請求項専用エンジンも搭載しています。また、自社独自の翻訳エンジンを作成・販売することも可能です。
| 初期費用 | 無料 | 
| 月額費用(プラン) | 22,000円~ | 
| 主な機能 | PDF翻訳機能、逆翻訳機能など | 
| 対応言語 | 日本語、英語、中国語などの各言語に対応 | 
| サポート | あり | 
| 無料トライアル | あり | 
T-tact AN-ZIN®(ティータクト アンジン)について詳しく見る

Rimo Voiceは、スマートフォンなどで録音した会議の音声などをアップロードすることで、文字に自動変換できるAI音声認識製品です。日本語に特化した自然言語処理技術が用いられているため、外国語を翻訳することはできません。ただし、高い精度で日本語を認識することができます。
また、録音データが一定期間残る仕様になっているため、ボイスレコーダーとして活用することも可能です。さらに、会議の参加者全体にシェアすれば、そのデータを議事録として代用できるという魅力もあります。文字起こし結果や音声データのダウンロードが可能である点も、大きなメリットといえます。
| 初期費用 | 月額料金1ヵ月分 | 
| 月額費用(プラン) | 30,000円~ | 
| 主な機能 | ファイルのアップロード・ダウンロード機能、録音機能など | 
| 対応言語 | 日本語 | 
| サポート | あり | 
| 無料トライアル | あり | 

メタデータ株式会社が提供している感情解析APIは、生データの感情判断を手軽に行うことができる感情解析AI製品です。日本語の文章を「好ましい―嫌い」「嬉しい―悲しい」「怒り―怖れ」の3軸で、6種の感情をそれぞれ3段階 +1 (0=中立) で解析し、文章に表現された感情を手軽に数値として抽出します。3軸7段階で感情を判断するため、ネガポジ判断よりもさらに精密な感情判断を行うことが可能です。
そんな感情解析APIの活用方法の一例としては、従業員のストレスチェックが挙げられます。近年はメンタルヘルスケアが話題となっていますが、人間の感情と心は密接な関係にあります。感情解析APIは6種の感情を段階に分けて解析し、ユーザーが書いた文章から感情の状態を解析します。過酷な仕事に携わるスタッフのストレスや不安のレベルの指標の一つとして、感情解析APIの活用が期待できるのです。
また、学校教育の分野でも有効活用できるでしょう。学校では、子どもの感情を文章からくみ取る学習ソフトウェアへの活用が期待されています。今後ますます進んでいく教室のデジタル化によって、子どもたちの考えた文章のデータが蓄積されていくことが考えられるわけです。そのため、近年では自閉症の子どもが他人の感情を認識するための手助けをする学習システムも研究されています。
| 初期費用 | 要問合せ | 
| 月額費用(プラン) | 要問合せ | 
| 主な機能 | 3軸7段階での感情分析機能など | 
| 対応言語 | 日本語 | 
| サポート | あり | 
| 無料トライアル | あり | 

メタデータ株式会社が提供している「5W1H抽出API ~個人情報保護に!」は、イベントを表すメタデータである5W1H「いつ、どこで、何を、誰が、どのように、いくらほど(数量表現)」を日本語の文章から抽出し、数値化・正規化してAtom-gData形式で出力するAPIです。アンケート自由回答やソーシャルメディアの書き込み等の生データから、マーケティングに有用なメタデータを抽出することができます。
具体的には、日本語テキストを受け取り、そこに含まれている日時・地名・人名といったイベントのメタデータを抽出して、数値化、正規化してAtom-gData 形式で返すというもの。 また、リアルタイムモードで提供するので、例えば今年の9月28日に「再来週金曜日朝八時」という表現を解析する と”2010-10-15T08:00:00+9:00″と出力します。
そんな「5W1H抽出API ~個人情報保護に!」の活用例としては、議事録起こしなどの作業が挙げられます。会議録の音声認識結果に5W1Hを適用すれば、次回予定や売上情報、予定価格などを漏らさず議事録起こしできます。営業日報については、新人がいつどこで誰と会っていくらの見積もりを提示したのかを書かずにポエムのような内容になっていないかを採点し、改善へとつなげていくことが可能です。
| 初期費用 | 要問合せ | 
| 月額費用(プラン) | 要問合せ | 
| 主な機能 | メタデータの抽出機能、匿名化機能 | 
| 対応言語 | 日本語 | 
| サポート | あり | 
| 無料トライアル | あり | 

参照:株式会社シーエーシー
株式会社シーエーシーが提供している「Empath」は、音声等のから人間の気分の状態を独自のアルゴリズムで判定するプログラムです。数万人の音声データベースを元に喜怒哀楽や気分の浮き沈みを判定することができます。また、JavaScriptをWebサイト上に埋め込むだけで簡単に感情解析技術を導入可能です。
そんな「Empath」の活用例としては、メンタルヘルスケアが挙げられます。声の状態から、感情を解析し、精神状態の測定結果を出すことによって、ストレスチェックやメンタルトレーニングにつなげることができるのです。実際に Empathでは、メンタルヘルスケアでは多数の実績があります。
また、「Empath」は声から感情を解析するので、面接のシーンなどを想定したコミュニケーションテストにも最適といえます。自己紹介の練習から相手に伝わる印象テストを結果として出すことができます。
| 初期費用 | お問い合わせください | 
| 月額費用(プラン) | お問い合わせください | 
| 主な機能 | 喜怒哀楽や気分の浮き沈み判定機能など | 
| 対応言語 | 日本語 | 
| サポート | あり | 
| 無料トライアル | お問い合わせください | 
今回は、音声認識の仕組みや活用例、導入事例、おすすめのアプリなどを紹介しました。音声認識は、人間の発話内容を解析してテキストに変換する技術です。音声認識を活用することで、議事録作成や文字起こしを自動化でき、業務効率化に大きく貢献すると考えられています。また、多言語間の通訳・翻訳などもできるため、グローバル会議などでも活用できます。
音声認識アプリにはさまざまな種類があり、無料で利用できるアプリも多く存在します。音声認識を導入する際は、自社の課題を明確にしたうえで、自社に合った製品を選んでいきましょう。音声認識AIカオスマップを公開していますので、ぜひ製品の比較検討を行う際の参考にしてみてください。
AIについて詳しく知りたい方は以下の記事もご覧ください。
AI・人工知能とは?定義・歴史・種類・仕組みから事例まで徹底解説
            業務の課題解決に繋がる最新DX・情報をお届けいたします。
メールマガジンの配信をご希望の方は、下記フォームよりご登録ください。登録無料です。
          
AI製品・ソリューションの掲載を
希望される企業様はこちら