生成AI

最終更新日:2024/04/10
Web会議が増えた今、議事録作成に時間がかかっていませんか?今回は、TBSテレビが開発した文字起こしエディタ「もじこ」を実際に使ってみた使用感をレポートします。文字起こしサービスを比較したい方や「もじこ」に興味がある方は是非ご活用ください。
もじこは、TBSテレビが開発した「文字起こしエディタ」です。放送局では日々、多くの文字起こしが行われていますが、文字起こしは地獄です。この地獄を劇的に変えるツールとしてもじこは開発されました。活用事例は、TBSやMBSなどのJNNネットワーク各局、活字メディア、会議の議事録作成などさまざまなシーンが挙げられます。
また技術面でも高く評価され、「日本民間放送連盟賞 優秀賞」「映像情報メディア学会 進歩開発賞」「日本映画テレビ技術協会 技術開発賞」を受賞、映像・放送業界における技術部門三冠を達成している議事録作成AIツールです。
もじこの受賞歴
もじこは音声認識AIエンジンを使って動画や音声から文字をテキストに起こします。ディープラーニングの技術を用いた音声認識エンジンでは、音の分析から文章のつながりの判定といった音声認識のプロセスが1つのディープニューラルネットワークモデルで実装されています。音声認識の仕組みの詳細は下記記事で詳しくご紹介しています。
ここからは、もじこを実際に使ってみた特徴をレビューしていきます。「もじこ」の利用には、ユーザー認証にあたって G Suite のアカウントが必要になります。すでに Google Workspace(G Suite)を導入されているお客様は、既存のGoogle Workspace(G Suite)環境にて「もじこ」の利用が可能です。
文字起こしにおいて最も重要視されるのは、何といっても音声認識の精度でしょう。精度がよければ人間が手作業で修正する箇所を少なく、作業時間を最小限に抑えられます。
利用シーンに合わせて音声認識エンジンを選択できるのはもじこの強みの一つです。世界125 以上の多言語に対応して高い認識率を誇る 「Google Cloud Speech-to-Text API 」と、日本語の文字起こしに特化した「AmiVoice」から選択が可能です。
※多言語対応のもじこですが、翻訳機能は搭載していません。翻訳する際は文字起こしテキストをGoogle翻訳などの翻訳ツールの処理が必要です。
今回、精度を試すために下記3つの例文で試しました。
もじこはリアルタイム文字起こしとアップロードしたファイルの文字起こしのどちらも対応しています。もじこの公式サイトは、静かな場所で話者が「はっきり」と「ゆっくり」かつ「大きな声」で話すこと、音声ファイルの品質はmp3/AACよりWAV(PCM)の高品質な設定で収録することを推奨しています。
今回はAmiVoiceの音声認識エンジンを使用してリアルタイム音声認識の精度を確認しました。録音は手持ちのノートパソコンのマイクで行いました。在宅勤務のため、周囲のノイズは少ない静音な環境です。
結果は、「明日10時にお約束しているミーティング」が「明日10時におやつを約束しているミーティング時間」と認識されてしまった他は、高い精度で認識してくれました。とはいえ意図していない箇所も「もじこ」なら簡単に修正できますので、それほど気にはなりませんでした。
今回の検証では、パソコンのマイクを使っているためか100%の精度とはいきませんでした。ですが、PCMレコーダーなど外部マイクを使うことでさらなる精度向上が期待できます。
取材の録音ファイルをもじこにアップロードした際は5分ほどで約2万字の文字起こしを処理してくれました。文字起こしの処理速度も申し分ありません。
認識精度も高いですが、間違えた場所、分かりづらい箇所だけをピンポイントで再生して、簡単に修正出来るのでエディタとしてとても使いやすいと感じました。
もじこの管理画面では、認識結果の修正はもちろん話者を自由に設定したりタイムコード連携が可能です。使ってみて便利だった機能は文章ブロックの分割と結合です。
文章ブロックの分割と結合は2021年夏に行われたもじこの大幅アップデートで実装されました。これまでAIの都合で決められていた、文字起こし結果文章の切れ目=「文章ブロック」を自由に分割・結合できます。
2021年夏のリニューアルでは、ネットワーク切断に対しての対応を強化した結果、文字起こしができない・固まる現象が改善したそうです。実際に使ってみましたが文字起こしができない・固まるといった事象は確認できませんでした。
その他にも、テキストごとにメモを追加できたり、サムネイル画像の表示、タイムコード連携ができ管理画面上で効率的な文字起こし作業が可能です。
下記4種類のフォーマットで出力することも可能ですので、WordやExcel上で閲覧や編集も可能です。
もじこにアップロードされた音声ファイルは、もじこファイルとしてGoogle Driveのマイドライブ内に生成される[mojiko]フォルダに保存されます。動画の場合は音声のみ抽出されて、同様にGoogle Drive内にもじこファイルとして保存されます。もじこのサービス提供側に動画・音声ファイルが保存されず安心して利用できます。
料金 | |
初期費用 | 無料 |
月額基本料金 | 15,000円 / 月 |
文字起こし料金 | 25円 / 分 (文字起こしを行う素材の長さによる従量課金) |
もじこは初期費用が無料!月額料金は15,000円です。別途文字起こし料金が1分あたり25円かかります。時間ごとのパック料金ではありませんが、文字起こし料金は比較的安価なため、毎月長時間の音声や動画の文字起こしと向き合う方におすすめです。
現在、導入検討中の方向けに、14日間の無料トライアルも実施中です。まずはもじこの音声認識精度や管理画面の使いやすさを無料トライアルでお試ししてみてはいかがでしょうか。
出典:PR TIMES
業務の課題解決に繋がる最新DX・情報をお届けいたします。
メールマガジンの配信をご希望の方は、下記フォームよりご登録ください。登録無料です。
AI製品・ソリューションの掲載を
希望される企業様はこちら