生成AI

AIエージェント
生成AI
ChatGPT連携サービス
AI受託開発
対話型AI -Conversational AI-
ボイスボット
バーチャルヒューマン
教師データ作成
AI研究開発
通訳・翻訳
声紋認証
機密情報共有・管理
契約書管理システム
ワークステーション
FAQシステム
AIカメラ
生体認証
インボイス制度対応システム
データセットの収集・購入
コールセンター
人事・総務向け
インバウンド対策
コンバージョンアップ
KYT・危険予知で労働災害防止
無料AI活用
顧客リスト自動生成
ロボットで自動化
LINE連携
セキュリティー強化
テレワーク導入
AI学習データ作成
配送ルート最適化
非接触AI
受付をAIで自動化、効率化
AIリテラシーの向上サービス
日本語の手書き文字対応AI-OCR
Windows作業の自動化RPAツール
リスク分析AIで与信管理
紙帳票仕分けAI-OCRサービス
サプライチェーン
AIコンサルティング
最終更新日:2024/08/23
Apple 画像生成AI Matryoshka公開
Appleは、高解像度の画像生成に最適化したAIモデル「Matryoshka Diffusion Models」を公開しました。さらに、GitHubで提供されるモデルのトレーニング用Pythonパッケージ「ml-mdm」も公開しています。
このAIニュースのポイント
Appleは8月9日、画像生成AIモデル「Matryoshka Diffusion Models」(MDM)および、モデルをトレーニングするためのPythonパッケージ「ml-mdm」を発表しました。高解像度の画像や動画を生成するためのエンドツーエンドのフレームワークとして、GitHubで公開されています。
従来の画像生成の方法では、低解像度モデルと複数のアップスケーリングモジュールを組み合わせた段階的なモデルを使用しており、高次元空間での拡散モデルの学習は計算上あるいは最適化をする上での課題を抱えていました。

これに対しMDMは、異なる解像度のモデルをマトリョーシカ構造のように並行して生成し、その情報を相互に共有します。これにより低解像度から高解像度へと学習アーキテクチャが段階的に成長し、高解像度生成の最適化が大幅に改善されます。

MDMの有効性は、ImageNetなどの標準的なデータセットだけでなく、高解像度のテキストから画像やビデオに生成できるアプリケーションなど、さまざまなベンチマークで検証されました。
その成果の一つとして、最大1024×1024ピクセルの解像度で単一のピクセル空間モデルをトレーニングさせることができ、1,200万組の画像・テキストからなるCC12Mデータセットを用いて、ゼロショット(事前学習データから、未知の概念やスタイルを生成すること)の一般化を実証しています。
MDMは画像生成における計算負荷を減らし、従来の方法よりも効率的でスケーラブルなソリューションを提供します。高品質な画像や動画を生成するための堅牢なフレームワークとして、この分野での将来の発展に大きな可能性を秘めています。
業務の課題解決に繋がる最新DX・情報をお届けいたします。
メールマガジンの配信をご希望の方は、下記フォームよりご登録ください。登録無料です。
AI製品・ソリューションの掲載を
希望される企業様はこちら