生成AI

AIエージェント
生成AI
ChatGPT連携サービス
AI受託開発
対話型AI -Conversational AI-
ボイスボット
バーチャルヒューマン
教師データ作成
AI研究開発
通訳・翻訳
声紋認証
機密情報共有・管理
契約書管理システム
ワークステーション
FAQシステム
AIカメラ
生体認証
インボイス制度対応システム
データセットの収集・購入
コールセンター
人事・総務向け
インバウンド対策
コンバージョンアップ
KYT・危険予知で労働災害防止
無料AI活用
顧客リスト自動生成
ロボットで自動化
LINE連携
セキュリティー強化
テレワーク導入
AI学習データ作成
配送ルート最適化
非接触AI
受付をAIで自動化、効率化
AIリテラシーの向上サービス
日本語の手書き文字対応AI-OCR
Windows作業の自動化RPAツール
リスク分析AIで与信管理
紙帳票仕分けAI-OCRサービス
サプライチェーン
AIコンサルティング
最終更新日:2024/02/20
NVIDIAは、AI アバター作成用プラットフォーム「NVIDIA Omniverse Avatar」を発表しました。 リアルタイムでの対話型 AI アシスタントが可能になります。
このAIニュースのポイント
2021 年 11 月 9 日、NVIDIA は本日、インタラクティブな AI アバターを生成するためのテクノロジ プラットフォームである、NVIDIA Omniverse Avatar を発表しました。
Omniverse Avatar は、音声 AI、自然言語理解、レコメンデーション エンジンおよびシミュレーションといった領域における、NVIDIA のテクノロジが組み合わされたものです。このプラットフォームで作成されたアバターは、レイトレーシングされた 3D グラフィックスによる、インタラクティブなキャラクターで、見ること、話すこと、多様な話題について会話することができ、自然に話された意図を理解することができます。
Omniverse Avatar は、ほぼすべての業界向けに簡単にカスタマイズできる AI アシスタントの創造への扉を開きます。この AI アシスタントは、レストランでの注文や銀行取引、個人的なアポイントメントと予約といった、日々の数十億のカスタマー サービスのやり取りで使用することができるため、ビジネス機会の拡大と顧客満足度の向上が期待されます。
Omniverse Avatar は、3D ワークフローを実行する、仮想世界のシミュレーションおよびコラボレーションのためのプラットフォームである NVIDIA Omniverse™ の一部で、現在オープンベータで7万人以上のユーザーが利用しています。
デモンストレーションでは、NVIDIA の創業者/CEO であるジェンスン フアンそっくりのおもちゃとして作られたアバターと同僚とのリアルタイムでの会話を披露し、生物学や気候科学といったトピックについて話しました。

そのほか、カスタマーサービス担当のアバターを紹介。このアバターは、2 人の客を見て、彼らと会話し、ベジタブル バーガー、フライドポテトおよび飲み物の注文を理解しました。このデモンストレーションでは、NVIDIA AI ソフトウェアと、現在世界最大のカスタマイズ可能な言語モデルとなっている、NVIDIA の言語生成モデル、Megatron-Turing NLG 530B を使用。
AIプラットフォーム DRIVE Concierge のデモでは、中央のダッシュボード画面に表示されたデジタル アシスタントが、ドライバが時間通りに目的地に到着するための最適な走行モードの選択をサポートし、車の航続距離が100マイル以下になったらリマインダーを設定するというリクエストに従います。
さらにフアンは、仮想コラボレーションおよびコンテンツ制作用アプリケーションに最先端の動画と音声機能をもたらすことのできる、Project Maxine を紹介しました。英語話者が騒々しいカフェでビデオ通話をしているところが映し出されていますが、彼女は背景の雑音に関係なく、音声をはっきりと聞き取れています。彼女が話すと、彼女の言葉は、リアルタイムで書き写され、さらに彼女と同じ声とイントネーションでドイツ語、フランス語、とスペイン語に翻訳されています。
・音声認識は、複数言語の音声を認識するソフトウェア開発キットである NVIDIA Riva がベースとなっています。Riva は、テキストから音声に変換する機能を使って、人間と同じような会話応対を生成するためにも使用。
・自然言語理解は、人間の言語を認識、理解および生成することのできる、NVIDIA の Megatron 530B Large Language Model がベース。Megatron 530B は、ほとんど、あるいは全く学習することなく、複雑な文の作成、幅広い分野の質問への回答、長くて複雑なストーリーの要約、他の言語への翻訳、特別に学習されていない多くの分野への対応が可能な、事前に学習されたモデル。
・レコメンデーション エンジンでは、大量のデータを処理して、賢明な提案をするのを可能にするディープラーニングレコメンデーションシステムを構築するためのフレームワークである、NVIDIA Merlin™ を採用。
・認知機能では、ビデオ分析用のコンピューター ビジョン フレームワークである、NVIDIA Metropolis を活用
・アバターのアニメーションでは、2D および 3D の AI によるフェイシャル アニメーションとレンダリング技術である、NVIDIA Video2Face と Audio2Face も使用。
これらの技術はアプリケーションに組み込まれ、NVIDIA Unified Compute Framework を使ってリアルタイムで処理されます。拡張性に優れ、カスタマイズ可能なマイクロサービスとしてパッケージされた、これらのスキルは、NVIDIA Fleet Command™ によって、複数の場所にわたって、安全に導入、管理および集約することができます。
出典:PR TIMES
業務の課題解決に繋がる最新DX・情報をお届けいたします。
メールマガジンの配信をご希望の方は、下記フォームよりご登録ください。登録無料です。
AI製品・ソリューションの掲載を
希望される企業様はこちら