生成AI

AIエージェント
生成AI
ChatGPT連携サービス
AI受託開発
対話型AI -Conversational AI-
ボイスボット
バーチャルヒューマン
教師データ作成
AI研究開発
通訳・翻訳
声紋認証
機密情報共有・管理
契約書管理システム
ワークステーション
FAQシステム
AIカメラ
生体認証
インボイス制度対応システム
データセットの収集・購入
コールセンター
人事・総務向け
インバウンド対策
コンバージョンアップ
KYT・危険予知で労働災害防止
無料AI活用
顧客リスト自動生成
ロボットで自動化
LINE連携
セキュリティー強化
テレワーク導入
AI学習データ作成
配送ルート最適化
非接触AI
受付をAIで自動化、効率化
AIリテラシーの向上サービス
日本語の手書き文字対応AI-OCR
Windows作業の自動化RPAツール
リスク分析AIで与信管理
紙帳票仕分けAI-OCRサービス
サプライチェーン
AIコンサルティング
最終更新日:2023/12/08
Google マルチモーダルAIモデル「Gemini」発表
Googleは12月6日、マルチモーダルな次世代生成AIモデル「Gemini」を発表しました。
このAIニュースのポイント
米Googleは12月6日(現地時間)に、生成AI向けの新しい大規模言語モデル「Gemini(ジェミニ)」の最初のバージョンを発表しました。
最初のバージョンである「Gemini 1.0」では「Ultra」「Pro」「Nano」と処理能力の異なる3つのモデルが存在し、求めるタスクによって最適化されています。
画像、音声、テキストのリクエストを同時に処理できるマルチモーダルに対応しており、中でも「Gemini Ultra」は、生成AIのモデルを評価するために使われているベンチマークテストにて、32のベンチマークのうち30で、競合するOpenAIのChatGPT-4よりも上位の性能を記録しています。
また、MMLU(大規模マルチタスク言語理解)と呼ばれる、数学・物理学・歴史・法律・医学・倫理など57科目の組み合わせで知識や問題解決能力を測るテストでは「90.00%」のスコアを記録しました。Googleはこの結果を「人間の専門家を上回るパフォーマンスを示した初のモデル」と述べています。

従来の生成AIモデルでは、画像、音声、テキストなどを別々に学習して組み合わせていましたが、Geminiではマルチモーダルに対応するためゼロから学習し直して開発されています。これにより、画像、音声、テキスト、映像などの様々な種類の情報を一般化し、シームレスに理解することが可能です。
デモ映像では、人が描いた「絵」や「動き」「音」なども把握してGeminiが論理的に回答している様子が伺えます。
「Gemini Pro」は同日より、生成AIボット「Bard」にテキストベースの生成AIとして、まずは170以上の国と地域で英語での利用が開始しました。随時、さまざまなモダリティへの拡大や、新しい言語と地域のサポートを予定しています。
また「Gemini Nano」はGoogleのハイエンドAndroidスマートフォン「Pixel 8 Pro」に搭載予定です。「Gemini Nano」により、レコーダー アプリの要約やGboardのスマートリプライなどの新機能を強化します。
今回発表されたモデル「Gemini 1.0」はGoogle 社内で設計されたTensor Processing Unit (TPU) v4 および v5e を使用して、トレーニングしています。

さらにGoogleは、AIモデルのトレーニングに特化して設計した新たなTPUシステム「Cloud TPU v5p」も併せて発表。このTPUシステムにより、今後Geminiの開発を加速させるとコメントしています。
出典:Google
業務の課題解決に繋がる最新DX・情報をお届けいたします。
メールマガジンの配信をご希望の方は、下記フォームよりご登録ください。登録無料です。
AI製品・ソリューションの掲載を
希望される企業様はこちら