生成AI

最終更新日:2026/04/01
Gemini 3.1 Flash Live 提供開始
Googleは、リアルタイム音声対話モデルの最新版「Gemini 3.1 Flash Live」の提供を開始しました。音響的なニュアンスの認識精度が向上し、より自然な対話や複雑なタスク処理の対応が可能です。
このニュースのポイント
米Googleは、リアルタイム音声対話の最新モデル「Gemini 3.1 Flash Live」の提供を開始しました。開発者、企業、そして一般ユーザーに、より直感的な体験を提供します。
本モデルは、Geminiのリアルタイム対話機能を進化させ、次世代の音声ファーストAIに必要なスピードと自然なリズムを実現しました。全体的な品質と信頼性の向上により、開発者や企業は、複雑なタスクを大規模に処理する音声ファーストのエージェントを構築できます。


さまざまな制約条件下で複数ステップの関数呼び出し能力を測るベンチマーク「ComplexFuncBench Audio」では、従来モデルを上回る90.8%のスコアを獲得しました。

Scale AIの「Audio MultiChallenge」では、思考機能をオンにした状態で36.1%のスコアを獲得しました。このテストは、実際の音声会話特有の中断やためらいがある状況下で、複雑な指示に従う能力や長期的な推論能力を測るものです。
本モデルは、より自然な対話のため、声のトーンやペースの認識精度が向上しています。法人向け「Gemini Enterprise for Customer Experience」では、従来モデル以上に音響的なニュアンスを認識し、ユーザーの不満や混乱にも臨機応変に応答します。


騒がしい環境でも複雑なタスクを処理できる音声対応エージェントを構築できるほか、音声を使ったコード入力や、素早い反復作業も可能です。
「Gemini Live」や「Search Live」機能では、日常の簡単な質問から複雑な会話まで、より有用で自然な応答を提供します。

Gemini Liveは本モデルの搭載により、従来モデルと比較してより速い応答を提供します。会話の流れを従来の2倍長く維持でき、長時間のブレインストーミングでも思考の流れを途切れさせることなく進めることができます。

「Search Live」がグローバル展開することも今週発表されました。この機能拡張は「Gemini 3.1 Flash Live」が多言語対応が標準装備であることによって実現しました。200以上の国と地域で、自分が好む言語で検索し、リアルタイムでマルチモーダルな会話ができるようになります。
なお、本モデルで生成されるすべての音声には、SynthIDの透かしが入っています。この目に見えない透かしは音声出力に直接埋め込まれており、AI生成コンテンツを確実に検出して誤情報の拡散を防ぐのに役立ちます。
「Gemini 3.1 Flash Live」は、Google製品全体で利用可能です。
出典:Google
業務の課題解決に繋がる最新DX・情報をお届けいたします。
メールマガジンの配信をご希望の方は、下記フォームよりご登録ください。登録無料です。
AI製品・ソリューションの掲載を
希望される企業様はこちら