Googleが次世代AI「Gemini 1.5」発表、長文理解能力が飛躍

最終更新日:2024/02/20

Gemini 1.5 発表

Googleは、次世代モデル「Gemini 1.5」を発表しました。「Gemini 1.5」は、最大100万トークンの処理能力と新MoEアーキテクチャで長文理解を革新し、AI開発の新たな可能性を提示します。

このAIニュースのポイント

「Gemini 1.5」は最大100万トークン処理で長文理解能力が飛躍
新MoEアーキテクチャ採用で効率と性能を大幅向上
倫理テストと安全性テストを実施し、責任あるAI開発を推進

Googleは、AI技術の最新進化として「Gemini 1.5」を発表しました。このモデルは、AIの理解能力と処理能力の大幅な向上を実現し、特に長文の理解において革新的な進歩を達成しています。

Gemini 1.5は、最大100万トークンの連続処理が可能で、これにより従来のAIモデルの限界を超える情報量を扱えるようになります。この技術的進歩は、AIがより複雑な問題を解決し、新しいアプリケーションの開発を可能にします。

Gemini 1.5の開発には、新たにMixture-of-Experts(MoE)アーキテクチャが採用されています。このアーキテクチャは、特定のタスクに最適な「エキスパート」ニューラルネットワークを選択的に活用することで、モデル全体の効率と性能を大幅に向上させます。このモデルは、テキスト、コード、画像、音声、動画といった複数のモダリティにわたるタスクで、前モデルを上回るパフォーマンスを発揮します。

Gemini 1.5は、特定のプロンプト内の大量のコンテンツをシームレスに分析、分類、要約することができ、例えば、アポロ11号の月面着陸に関する402ページの記録の文書内にある会話、出来事、画像、詳細について推論が可能です。

さらに、動画などのさまざまなモダリティに対する高度な理解と推論のタスクを実行できるため、44 分間のバスター・キートンの無声映画では、モデルはさまざまなプロットや出来事を正確に分析し、映画内の見逃しがちな小さな詳細についても推論することができます。

またGoogleは、Gemini 1.5のリリースに先立ち、広範な倫理テストと安全性テストを実施しています。これにより、AI原則に基づいた責任ある開発を確保し、AIシステムの継続的な改善を行っています。Gemini 1.5は、AI技術の可能性をさらに広げ、数十億の人々やデベロッパー、企業に新たな価値を提供することが期待されています。

今後、GoogleはGemini 1.5を基盤として、AIの能力をさらに拡張し、新しいアプリケーションやサービスの開発を進めていく予定です。

出典：Google