生成AI

AIエージェント
生成AI
ChatGPT連携サービス
AI受託開発
対話型AI -Conversational AI-
ボイスボット
バーチャルヒューマン
教師データ作成
AI研究開発
通訳・翻訳
声紋認証
機密情報共有・管理
契約書管理システム
ワークステーション
FAQシステム
AIカメラ
生体認証
インボイス制度対応システム
データセットの収集・購入
コールセンター
人事・総務向け
インバウンド対策
コンバージョンアップ
KYT・危険予知で労働災害防止
無料AI活用
顧客リスト自動生成
ロボットで自動化
LINE連携
セキュリティー強化
テレワーク導入
AI学習データ作成
配送ルート最適化
非接触AI
受付をAIで自動化、効率化
AIリテラシーの向上サービス
日本語の手書き文字対応AI-OCR
Windows作業の自動化RPAツール
リスク分析AIで与信管理
紙帳票仕分けAI-OCRサービス
サプライチェーン
AIコンサルティング
最終更新日:2024/04/17
xAI Grok-1.5V発表
xAIは、独自LLM「Grok」の更新版「Grok-1.5V」を発表しました。マルチモーダルモデルで画像認識が可能です。
このAIニュースのポイント
イーロン・マスク氏が設立した人工知能開発企業、xAIは、自社独自LLM「Grok」の更新版「Grok-1.5V」を発表しました。
「Grok-1.5V」は、同社初のマルチモーダルモデルです。テキスト機能に加えて、文書、図、チャート、スクリーンショット、写真など、さまざまな視覚情報の処理が可能です。
具体例として、食品の栄養表示画像から正しいカロリーを計算することを挙げています。画像を提示し「5枚で何キロカロリーありますか」と質問をすると、栄養表示内容を踏まえて計算のプロセスを解説し、合計で100キロカロリーだと回答しています。
他にも、描いた絵から架空の物語を生成することもできます。

またxAIは、現実世界を理解する実用的なAIアシスタントの開発には、物理・世界についてのモデルの理解を高めることが重要と考えており、新しいベンチマークの「RealWorldQA」を導入しています。
RealWorldQAの初回リリースには700枚以上の画像を含み、各画像には質問と簡単に検証できる回答が付属されています。

モデル性能の点では、Grok-1.5V は、学際的な推論や文書、科学図、チャート、スクリーンショット、写真の理解に至るまで、多くの領域で既存のマルチモーダルモデルと競合する性能を持ちます。「RealWorldQA」ベンチマークにおいては、競合製品を上回っています。

xAIは、今後数ヶ月のうちに、画像・音声・映像などの様々なモダリティにおいて、マルチモーダルの理解能力と生成能力の改善を行う予定だとコメントしています。
出典:xAI
業務の課題解決に繋がる最新DX・情報をお届けいたします。
メールマガジンの配信をご希望の方は、下記フォームよりご登録ください。登録無料です。
AI製品・ソリューションの掲載を
希望される企業様はこちら