生成AI

最終更新日:2024/12/24
Googleは、12月11日(現地時間)、次世代AIモデル「Gemini 2.0」とそれに関連する多数の取り組みを発表しました。
このニュースのポイント
米Googleは、12月11日(現地時間)、次世代AIモデル「Gemini 2.0」とそれに関連する多数の取り組みを発表しました。「Gemini 2.0」は、画像、動画、音声など様々な種類のデータを処理できるマルチモーダル出力機能を持つ大規模言語モデル(LLM)で、複雑なタスクを素早く理解し、実行することができます。
また、同日よりGemini Advancedのユーザーは「Gemini 2.0 Flash Expreimental」と「1.5 Pro with Deep Research」を利用できます。
開発者やテスター向けにリリースされた「Gemini 2.0 Flash Expreimental」は「Gemini 1.5 Flash」を基に構築され、高速な応答時間を維持したままパフォーマンスが向上しています。また、2.0 Flashは主要なベンチマークにおいて、1.5 Proを2倍の速度で上回っていることがわかっています。
「1.5 Pro with Deep Research」は、AIによる自動リサーチ機能で、高度な推論と長いコンテキスト機能が搭載されており、リサーチアシスタントとしてユーザーの代わりにAIがレポートを生成します。
「Gemini 2.0」では、次世代AIアシスタント「Project Astra」もアップデートされ、複数の言語が混在する会話が可能になり、アクセントや普段使わないような単語も理解できるよう進化しました。Googleでは、このような機能をGeminiアプリやAIアシスタントなどのGoogleサービスへ導入していき、プロトタイプメガネでのテストを開始する予定です。
Gemini 2.0に基づき構築された研究プロトタイプ「Project Mariner」は、ピクセルやテキスト、コード、画像情報など、ブラウザ上の情報を理解し、その情報をChrome拡張機能を使用してタスクを実行することが可能です。
さらに、Googleではビデオゲームの仮想世界をナビゲートするエージェントが開発しています。画面上のアクションに基づいてゲーム状況を推論し、リアルタイムの会話で次に取るべき行動を提示します。
Googleは、新たなモデルやエージェントを開発する中で、安全性と責任をモデル開発プロセスにおける重要な要素としています。今後も、信頼できるテスターや外部の専門家と協力し、広範なリスク評価と安全性と保証の評価を実施するなど、AGI(汎用人工知能)の実現に向けた開発を進めていく方針です。
出典:Google
業務の課題解決に繋がる最新DX・情報をお届けいたします。
メールマガジンの配信をご希望の方は、下記フォームよりご登録ください。登録無料です。
AI製品・ソリューションの掲載を
希望される企業様はこちら