生成AI

最終更新日:2024/04/26
AIベンチャーのSakana AIは、進化的モデルマージを適用した画像生成AI「EvoSDXL-JP」を4月22日に公開しました。
このAIニュースのポイント
AIベンチャーのSakana AIは、画像生成AI「EvoSDXL-JP」を公開しました。進化的モデルマージを適用した日本語対応画像生成モデルであり、従来の日本語モデルと比べ、約10倍速く画像を生成が可能です。
「進化的モデルマージ」は、自然界の原理を生かした進化的アルゴリズムを基盤とした手法であり、ユーザーが指定した能力に長けた新しい基盤モデルを自動的に作成可能です。また、勾配ベースの訓練を全く必要とせず、比較的少ない計算資源とデータで新しい基盤モデルを自動的に生成できます。
Sakana AIは3月に、「非英語言語と数学」「非英語言語と画像理解」といった、異なる領域のモデルの融合(マージ)を自動的に行い、高い性能の基盤モデルの構築に成功したことを発表しています。
今回発表された「EvoSDXL-JP」は、進化的モデルマージを2段階で適用しています。日本特化の画像生成モデルと英語の基盤画像生成モデルをマージし、日本語対応した高性能な画像生成モデルを構築した後、さらに高速画像生成モデルをマージすることで、日本語対応かつ高速な画像生成モデルの構築が実現されています。
また、性能評価では生成された画像と真の画像の近さを表すFID(小さい値ほど良い)と人間好みの度合いを測るHPS(Human Preference Score)(大きい値ほど良い)を利用したところ、どちらも最高性能であることが明らかになりました。
さらに推論速度の点では、40ステップを要する従来の日本語モデルと比べ、EvoSDXL-JP(モデル7)は4ステップと、10倍の推論速度で画像生成が可能です。
「EvoSDXL-JP」は、日本語対応した高速な画像生成AIのため、複雑なテキストを入力せずとも、テキストに沿った高精度な画像生成が可能です。
「波に乗っている1個のりんご」、「雲を泳ぐ魚のポートレート」と入力した生成結果
「お笑い芸人、編みぐるみ」、「お相撲さん、編みぐるみ」と入力した生成結果
「(ロボット魚、東京タワー、味噌ラーメン、スマートフォン)、最高品質の浮世絵、江戸時代。」入力した生成結果
今後のAI開発において、進化的アプローチにより既存のモデルを組み合わせることで、低コストで様々なモダリティのモデルを構築する傾向が強まると考えられています。またSakana AIは「EvoSDXL-JP」は生成AIを手軽に試し体験するのに最適なモデルであり、より多くの人に生成AIのメリットを享受してもらうためにも、日本の教育現場などでの使用を期待しているとコメントしています。
出典:Sakana AI
業務の課題解決に繋がる最新DX・情報をお届けいたします。
メールマガジンの配信をご希望の方は、下記フォームよりご登録ください。登録無料です。
AI製品・ソリューションの掲載を
希望される企業様はこちら