生成AI

AIエージェント
生成AI
ChatGPT連携サービス
AI受託開発
対話型AI -Conversational AI-
ボイスボット
バーチャルヒューマン
教師データ作成
AI研究開発
通訳・翻訳
声紋認証
機密情報共有・管理
契約書管理システム
ワークステーション
FAQシステム
AIカメラ
生体認証
インボイス制度対応システム
データセットの収集・購入
コールセンター
人事・総務向け
インバウンド対策
コンバージョンアップ
KYT・危険予知で労働災害防止
無料AI活用
顧客リスト自動生成
ロボットで自動化
LINE連携
セキュリティー強化
テレワーク導入
AI学習データ作成
配送ルート最適化
非接触AI
受付をAIで自動化、効率化
AIリテラシーの向上サービス
日本語の手書き文字対応AI-OCR
Windows作業の自動化RPAツール
リスク分析AIで与信管理
紙帳票仕分けAI-OCRサービス
サプライチェーン
AIコンサルティング
最終更新日:2024/12/17
基盤世界モデル「Genie 2」発表
Google DeepMindは、テキストや画像から多様な3D仮想世界を生成する新たなAI「Genie 2」を発表しました。
このニュースのポイント
米Google傘下のGoogle DeepMindは、テキストや画像から多様な3D仮想世界を生成する新たなAI「Genie 2」を発表しました。この基盤世界モデルは、エージェントのトレーニングと評価のために、無限にアクション制御可能でプレイ可能な3D環境を生成することができます。
また、ユーザーは単一のプロンプト画像に基づいて、キーボードとマウスを使用して人間またはAIエージェントがプレイできる環境を楽しむことができます。
「Genie 2」は、ユーザーのキーボード操作に基づくキャラクターの識別・移動機能や視界外情報の再現能力を持ち、新しいコンテンツを生成し多様な視点からビデオを生成できるツールです。生成できるのは1分間のみです。
これにより、新しいトレーニング環境が提供され、未来のエージェントは無限のカリキュラムで学習や評価が可能になるほか、リアルな物理法則やNPCの行動をシミュレートした仮想世界を生成することもできます。

さらに、現実世界の画像を使って自然な動きをモデル化した3Dワールドを生成します。様々なアクションの結果をシミュレートし、大規模なビデオデータセットでトレーニングされ、オブジェクトの相互作用やキャラクターアニメーション、物理学を予測する機能が搭載されています。
また、ユーザーはテキストで要望を伝えることで、そのアイデアに基づいたシミュレーションに参加できます。Google DeepMindがゲーム開発者と共同で開発したAIエージェント「SIMA」を活用した例では、Genie 2を使用して、青いドアと赤いドアの2つがある3D環境を生成し、SIMAエージェントにそれぞれのドアを開くように指示する実験が行われました。
この実験では、SIMAはキーボードとマウス入力でアバターを操作し、Genie 2がゲームフレームを生成しました。
また、SIMAはGenie 2の機能を評価するためにも使用できます。ここでは、SIMA に周囲を見回して家の裏を探索するように指示することで、一貫した環境を生成するGenie 2の能力をテストしています。
Google DeepMindは「研究は初期段階であり、生成機能の改善に注力しています。また、SIMAと同様に、オンラインおよび現実の人々に役立つ一般的なAIシステムとエージェントの構築を目指しています」とコメントしています。
業務の課題解決に繋がる最新DX・情報をお届けいたします。
メールマガジンの配信をご希望の方は、下記フォームよりご登録ください。登録無料です。
AI製品・ソリューションの掲載を
希望される企業様はこちら