DXを推進するAIポータルメディア「AIsmiley」| AI製品・サービスの比較・検索サイト
03-6452-4750 10:00〜18:00 年末年始除く

Googleが次世代AI「Gemini 1.5」発表、長文理解能力が飛躍

最終更新日:2024/02/20

Googleは、次世代モデル「Gemini 1.5」を発表しました。「Gemini 1.5」は、最大100万トークンの処理能力と新MoEアーキテクチャで長文理解を革新し、AI開発の新たな可能性を提示します。

このAIニュースのポイント

  • 「Gemini 1.5」は最大100万トークン処理で長文理解能力が飛躍
  • 新MoEアーキテクチャ採用で効率と性能を大幅向上
  • 倫理テストと安全性テストを実施し、責任あるAI開発を推進

Googleは、AI技術の最新進化として「Gemini 1.5」を発表しました。このモデルは、AIの理解能力と処理能力の大幅な向上を実現し、特に長文の理解において革新的な進歩を達成しています。

Gemini 1.5は、最大100万トークンの連続処理が可能で、これにより従来のAIモデルの限界を超える情報量を扱えるようになります。この技術的進歩は、AIがより複雑な問題を解決し、新しいアプリケーションの開発を可能にします。

Gemini 1.5の開発には、新たにMixture-of-Experts(MoE)アーキテクチャが採用されています。このアーキテクチャは、特定のタスクに最適な「エキスパート」ニューラルネットワークを選択的に活用することで、モデル全体の効率と性能を大幅に向上させます。このモデルは、テキスト、コード、画像、音声、動画といった複数のモダリティにわたるタスクで、前モデルを上回るパフォーマンスを発揮します。

Gemini 1.5は、特定のプロンプト内の大量のコンテンツをシームレスに分析、分類、要約することができ、例えば、アポロ11号の月面着陸に関する402ページの記録の文書内にある会話、出来事、画像、詳細について推論が可能です。

さらに、動画などのさまざまなモダリティに対する高度な理解と推論のタスクを実行できるため、44 分間のバスター・キートンの無声映画では、モデルはさまざまなプロットや出来事を正確に分析し、映画内の見逃しがちな小さな詳細についても推論することができます。

またGoogleは、Gemini 1.5のリリースに先立ち、広範な倫理テストと安全性テストを実施しています。これにより、AI原則に基づいた責任ある開発を確保し、AIシステムの継続的な改善を行っています。Gemini 1.5は、AI技術の可能性をさらに広げ、数十億の人々やデベロッパー、企業に新たな価値を提供することが期待されています。

今後、GoogleはGemini 1.5を基盤として、AIの能力をさらに拡張し、新しいアプリケーションやサービスの開発を進めていく予定です。

出典:Google

AIsmiley編集部

株式会社アイスマイリーが運営するAIポータルメディア「AIsmiley」は、AIの専門家によるコンテンツ配信とプロダクト紹介を行うWebメディアです。AI資格を保有した編集部がDX推進の事例や人工知能ソリューションの活用方法、ニュース、トレンド情報を発信しています。

・Facebookでも発信しています
@AIsmiley.inc
・Xもフォローください
@AIsmiley_inc
・Youtubeのチャンネル登録もお願いいたします@aiaismiley1345

メルマガに登録する

DXトレンドマガジン メールマガジン登録

業務の課題解決に繋がる最新DX・情報をお届けいたします。
メールマガジンの配信をご希望の方は、下記フォームよりご登録ください。登録無料です。

お名前 - 姓・名

お名前を入力してください

メールアドレス

メールアドレスを入力してください

AI・人工知能記事カテゴリ一覧

今注目のカテゴリー

ChatGPT連携サービス

チャットボット

画像認識・画像解析

需要予測

ChatGPT連携サービス

チャットボット

画像認識・画像解析

需要予測

AI活用のご相談したい企業様はこちら

03-6452-4750

AI製品・ソリューションの掲載を
希望される企業様はこちら