DXを推進するAIポータルメディア「AIsmiley」| AI製品・サービスの比較・検索サイト
03-6452-4750 10:00〜18:00 年末年始除く

Sakana AI、日本語対応画像生成AI「EvoSDXL-JP」を公開。既存モデルに比べ推論速度が10倍高速に

最終更新日:2024/04/26

AIベンチャーのSakana AIは、進化的モデルマージを適用した画像生成AI「EvoSDXL-JP」を4月22日に公開しました。

このAIニュースのポイント

  • Sakana AIが画像生成AI「EvoSDXL-JP」を公開。進化的モデルマージを適用
  • 従来の日本語モデルと比べ、推論速度が10倍も高速
  • 日本の教育現場などでの使用が期待される

AIベンチャーのSakana AIは、画像生成AI「EvoSDXL-JP」を公開しました。進化的モデルマージを適用した日本語対応画像生成モデルであり、従来の日本語モデルと比べ、約10倍速く画像を生成が可能です。

「進化的モデルマージ」は、自然界の原理を生かした進化的アルゴリズムを基盤とした手法であり、ユーザーが指定した能力に長けた新しい基盤モデルを自動的に作成可能です。また、勾配ベースの訓練を全く必要とせず、比較的少ない計算資源とデータで新しい基盤モデルを自動的に生成できます。

Sakana AIは3月に、「非英語言語と数学」「非英語言語と画像理解」といった、異なる領域のモデルの融合(マージ)を自動的に行い、高い性能の基盤モデルの構築に成功したことを発表しています。

今回発表された「EvoSDXL-JP」は、進化的モデルマージを2段階で適用しています。日本特化の画像生成モデルと英語の基盤画像生成モデルをマージし、日本語対応した高性能な画像生成モデルを構築した後、さらに高速画像生成モデルをマージすることで、日本語対応かつ高速な画像生成モデルの構築が実現されています。

また、性能評価では生成された画像と真の画像の近さを表すFID(小さい値ほど良い)と人間好みの度合いを測るHPS(Human Preference Score)(大きい値ほど良い)を利用したところ、どちらも最高性能であることが明らかになりました。

さらに推論速度の点では、40ステップを要する従来の日本語モデルと比べ、EvoSDXL-JP(モデル7)は4ステップと、10倍の推論速度で画像生成が可能です。

「EvoSDXL-JP」は、日本語対応した高速な画像生成AIのため、複雑なテキストを入力せずとも、テキストに沿った高精度な画像生成が可能です。

「波に乗っている1個のりんご」、「雲を泳ぐ魚のポートレート」と入力した生成結果

「お笑い芸人、編みぐるみ」、「お相撲さん、編みぐるみ」と入力した生成結果

「(ロボット魚、東京タワー、味噌ラーメン、スマートフォン)、最高品質の浮世絵、江戸時代。」入力した生成結果

今後のAI開発において、進化的アプローチにより既存のモデルを組み合わせることで、低コストで様々なモダリティのモデルを構築する傾向が強まると考えられています。またSakana AIは「EvoSDXL-JP」は生成AIを手軽に試し体験するのに最適なモデルであり、より多くの人に生成AIのメリットを享受してもらうためにも、日本の教育現場などでの使用を期待しているとコメントしています。

出典:Sakana AI

AIsmiley編集部

株式会社アイスマイリーが運営するAIポータルメディア「AIsmiley」は、AIの専門家によるコンテンツ配信とプロダクト紹介を行うWebメディアです。AI資格を保有した編集部がDX推進の事例や人工知能ソリューションの活用方法、ニュース、トレンド情報を発信しています。

・Facebookでも発信しています
@AIsmiley.inc
・Xもフォローください
@AIsmiley_inc
・Youtubeのチャンネル登録もお願いいたします@aiaismiley1345

メルマガに登録する

DXトレンドマガジン メールマガジン登録

業務の課題解決に繋がる最新DX・情報をお届けいたします。
メールマガジンの配信をご希望の方は、下記フォームよりご登録ください。登録無料です。

お名前 - 姓・名

お名前を入力してください

メールアドレス

メールアドレスを入力してください

AI・人工知能記事カテゴリ一覧

今注目のカテゴリー

ChatGPT連携サービス

チャットボット

画像認識・画像解析

需要予測

ChatGPT連携サービス

チャットボット

画像認識・画像解析

需要予測

AI活用のご相談したい企業様はこちら

03-6452-4750

AI製品・ソリューションの掲載を
希望される企業様はこちら