FLUX.1とは?特徴から使い方まで詳しく解説
最終更新日:2024/11/11
自分で書いたブログ記事にオリジナルの画像を入れて読者を楽しませたいと考える一方で、時間や手間がかかってしまい困っている方はいませんか?
近年、生成AIは進化のスピードがとても早いため、文章から画像を生成できるAIを活用するのも一つの手法です。
本記事では、高品質でニーズに合った画像を生成できる画像生成AIモデル「FLUX.1」について詳しく解説します。
FLUX.1とは?
FLUX.1とはBlack Forest Labsが開発した最新の画像生成AIモデルで、次のような特徴を持っています。
- テキストを入力するだけで画像が生成できる
- ニーズに合わせて、プロのデザイナー向けの「pro」開発者向けの「dev」個人向けの「schnell」の3つのモデルを使い分けられる
- 最大2.0メガピクセルの解像度を持つ画像を生成できる
- 11種類のアスペクト比の中から選んで画像を生成できる
- AIがプロンプトを理解しそれを元に画像を生成するための高度な技術と、12Bパラメータという大きな情報処理量を持つ
- APIを介してFLUX AI Image Generatorを利用できる
- FLUX AI Image Generatorでテキストから動画も作れる
高機能でありながら、初心者からプロまでさまざまなユーザーに対応できるのがFLUX.1の大きなメリットです。
参考:Black Forest Labsブログ「FLUX.1」
FLUX.1とStable Diffusionの違い
FLUX.1とよく比較される画像生成AIにStable Diffusionがありますが、この2つには次のような違いがあります。
項目 | FLUX.1 | stable diffusion |
画像の品質 | ●入力したテキストの文脈を理解し、その内容の再現性の高い画像を出力できる | ●写実的な画像の生成ができる |
カスタマイズ | ●FLUX.1のホームページ上で以下のようなことができる
1.画像をプロンプトに変換する |
●画像の欠けている部分や損傷した部分を修復したり、元の画像に新しい要素を自然に追加したりできるインペインティング機能がある
●画像の外側に追加部分を自然に広げて画像サイズを大きくできるアウトペインティング機能がある |
パフォーマンスと速度 | ●詳細さや正確さを損ねることなく迅速に画像を生成できる | ●画像生成の速度と忠実性のバランスが良い |
商用利用 | FLUX.1 [pro]
●モデルの商用利用不可 |
●商用利用可 |
FLUX.1 [dev]
●モデルの商用利用は要問い合わせ |
||
flux.1[schnell]
●モデルの商用利用可 |
||
無料での使用 | ●可 | ●可 |
これらの特徴の違いから、例えばFLUX.1はアート作品の生成、Stable Diffusionは人物像の生成などによく利用されています。
Stable Diffusionについて詳しく知りたい方はこちらをご覧ください。
参考:Stable Diffusionとは?話題の画像生成AIの使い方・初心者向けのコツも徹底解説!
FLUX.1の使い方
FLUX.1にはさまざまな使い方がありますが、無料で簡単に画像を生成する手順を紹介します。
- FLUX.1のホームページで「FLUX.1を使ってみる」というボタンをクリック
- Flux AI画像ジェネレータという枠内の「プロンプト」の部分にテキストを記入
- 画像のサイズを11種類のアスペクト比の中から選んで指定
- 「走る(Run)」をクリック
これらは一番簡単な使い方であり、FLUX.1の操作に慣れるためにもまずはこの方法から始めてみるとよいでしょう。
上記の方法に慣れて本格的に活用したい場合は、ローカル環境かプラットフォーム環境を選んで使うことになるため、それぞれの導入方法を紹介します。
ローカル環境での使い方
FLUX.1には、プロのデザイナー向けの「pro」開発者向けの「dev」個人向けの「schnell」の3つのモデルがあると紹介しましたが、ローカル環境では「pro」が使えないため注意が必要です。
また、推奨スペックには諸説ありますが、グラフィックが使用する専用のメモリで主に画像やビデオデータの処理に使われるVRAMの容量が重要な要素となり、24GB以上が望ましいとされます。
以下、ローカル環境での導入方法を2つ紹介します。
Stable Diffusion WebUI Forgeでの導入方法
Stable Diffusion WebUI Forgeでの導入は次の手順で行います。
- ソフトウェア開発プロジェクトを管理するためのプラットフォームであるGitHubのページから、Stability Matrixをインストールする
- Stability Matrixを開いたら、Stable Diffusion WebUI Forgeをインストールする
- 機械学習モデルやデータセットを共有・管理するためのプラットフォームであるHugging Faceのページから「flux1-dev-bnb-nf4-v2.safetensors」と「flux1-schnell-bnb-nf4.safetensors」をダウンロードする
- ダウンロードしたファイルを「Date > Models > StableDiffusion」フォルダに移動させる
ローカル環境に導入できたら、次の手順で画像が生成できます。
- UIの項目で「FLUX」を選択し、Checkpointの項目でダウンロードしたモデルを選ぶ
- プロンプトを入力し、「Generate」をクリックする
一度導入をすれば生成するのは簡単なため、手順を確認しながら。
ComfyUIでの導入方法
ComfyUIでの導入は次の手順で行います。
- GitHubのページからStability Matrixをインストールする
- Hugging Faceのページからflux1-dev.safetensorsをダウンロードし、ComfyUI/Models/unet/に格納する
- Hugging Faceのページからae.safetensorsをダウンロードしComfyUI/models/vae/に格納する
- Hugging Faceのページからt5xxl_fp16.safetensorsとclip_l.safetensorsをダウンロードしComfyUI/models/clip/に格納する
- ComfyUI_examplesから画像をダウンロードする進めてみましょう
- ダウンロードした画像をComfyUIにドラッグアンドドロップする
ローカル環境に導入できたら、次の手順で画像が生成できます。
- 「CLIP Text Encode」の枠にプロンプトを入力する
- 「Queue Prompt」をクリックする
こちらも一度導入をすれば生成するのは簡単なため、手順を確認しながらトライしてみましょう。
プラットフォーム環境での使い方
Replicate、fal.ai、mystic、deepinfra、Xの5つのプラットフォーム環境におけるFLUX.1の使い方を紹介します。
Replicateで使う方法
ReplicateでFLUX.1を使う場合、ホームページのファーストビュー内にReplicateにおけるFLUX.1の使い方が記載されたブログ記事へのリンクが黄色で表示されており、初心者にやさしい仕様となっています。
プロンプトやアスペクト比以外の設定項目は次の通りです。
- width
- height
- steps
- guidance
- interval
- safety_tolerance
- prompt_upsampling
- seed
- output_format
- output_quality
ローカル環境で使う場合より設定項目が増えて難しく感じるかもしれませんが、Replicateではこれらの項目の意味と設定方法が画面上に記載されているため、迷わず設定しやすい仕様となっています。
Replicateは初心者ではあるものの、自分の意図に合った画像を生成したい人におすすめです。
fal.aiで使う方法
fal.aiでFLUX.1を使う場合、使うモデルを選んでプロンプトを入力し「サインインして実行」のボタンを押せば画像が生成できます。
また、より細かく内容を設定したい人向けに「追加設定」ができる仕組みになっており、画像サイズ、推論ステップ数などの項目を追加で設定できます。
fal.aiは、まずFLUX.1を使ってみて、慣れてきたら細かい設定にも挑戦したい人におすすめです。
mysticで使う方法
mysticでFLUX.1を使う場合、FLUX.1-devのページかFLUX.1-schnellのページのどちらかにアクセスして画像を生成します。
どちらもプロンプトやアスペクト比などいくつかの項目を設定し「走る(Run)」をクリックすると画像が生成できます。
mysticは、FLUX.1で使うモデルが固定されている人におすすめです。
deepinfraで使う方法
deepinfraでFLUX.1を使う場合、以下のページにアクセスして画像を生成します。
どのページでもプロンプト、画像の幅、高さなどを設定して生成できますが、FLUX-1-devのページとFLUXー1ーschnellのページ下部には、主な機能や制限事項、禁止事項が記載されているのが特徴的です。
deepinfraは、FLUX.1で生成した画像をルールを守って使用したい人におすすめです。
Xで使う方法
Xにおいても、FLUX.1の画像生成機能を「プレミアムプラン」または「プレミアムプラスプラン」の加入者が使用できます。
XのAIアシスタントGrok2を通じてFLUX.1にアクセスし、画像を生成できる仕組みです。
チャットを使って生成ができ、日本語のプロンプトにも対応していますが、画像サイズはサイズは横長(1024 x 768ピクセル)のみとなります。
Xでポストとともにきれいな画像を発信したい人におすすめです。
FLUX.1の価格
FLUX.1には4種類のプランがあり、それぞれ価格が異なります。
プラン名 | クレジット数 | 月額払い | 年間一括払い |
Pro | 800クレジット | $22.9/月 | $15.9/ 月(年間$90.8) |
Basic | 400クレジット | $16.9/月 | $11.9/ 月(年間$142.8) |
Max | 1,500クレジット | $26.9/月 | $18.9/ 月(年間$226.8) |
Pro Max | 5,000クレジット | $42.9/月 | $29.9/ 月(年間$358.8) |
クレジットとは画像を生成するたびに消費する通貨のようなものです。
年間一括払いにすると30%オフなので、自分がどのくらいの画像数を生成したいのかと使用期間のバランスを考えて選ぶとよいでしょう。
FLUX.1のおすすめモデルとは?
FLUX.1には、プロのデザイナー向けの「pro」開発者向けの「dev」個人向けの「schnell」の3つのモデルがありますが、まずは個人向けの「schnell」から使ってみるのがおすすめです。
「schnell」を推奨する理由は以下の通りです。
- プラットフォーム環境で使いたい人の場合、選べるプラットフォームが多い
- ローカル環境でも使える
- モデルも生成した画像も商用利用できる
- 軽量
初心者で最初にどのモデルを使えばよいかわからない人は、選択肢が多い「schnell」から始めてみましょう。
FLUX.1のプロンプト
FLUX.1はテキストの指示に忠実に画像生成をするという特徴があるため、プロンプトは単語ではなく自然な文章で入力するのが望ましいといえます。
プロンプトを作成するコツは以下の通りです。
- 学習量が多い英語で指定する(翻訳ソフトなどを使って作るのもよい)
- 構図、色彩、雰囲気、光の当たり方などを詳細に指定する
- 画風を指定する
- ネガティブプロンプト(生成したくない要素)も含める
プロンプトはさまざまな種類で実験することが大切ですが、プロンプトの変化で生成される画像にどのような違いがあるかを研究した人が、結果を発信していることもあるため参考にするとよいでしょう。
まとめ
FLUX.1とは、Black Forest Labsが開発した最新の画像生成AIモデルで、テキストに忠実な画像を迅速に生成できるという特徴があります。
こちらの記事も参考にして、ぜひFLUX.1を活用してみてください。
- AIサービス
- 生成AI
- 画像生成AI
- AIモデル作成
- 広告・クリエイティブ
業務の課題解決に繋がる最新DX・情報をお届けいたします。
メールマガジンの配信をご希望の方は、下記フォームよりご登録ください。登録無料です。
AI・人工知能記事カテゴリ一覧
AI・人工知能サービス
- 生成AI
- 画像生成AI
- ChatGPT
- AI研究開発
- LLM
- DX推進
- おすすめAI企業
- チャットボット
- ボイスボット
- 音声認識・翻訳・通訳
- 画像認識・画像解析
- 顔認証
- AI-OCR
- 外観検査
- 異常検知・予知保全
- 自然言語処理-NLP-
- 検索システム
- 感情認識・感情解析
- AIモデル作成
- 需要予測・ダイナミックプライシング
- AI人材育成・教育
- アノテーション
- AI学習データ作成
- エッジAI
- IoT
- JDLA
- G検定
- E資格
- PoC検証
- RPAツール
- Salesforce Einstein
- Watson(ワトソン)
- Web接客ツール
- サプライチェーン
- メタバース
- AR・VR・デジタルツイン
- MI
- スマートファクトリー
- データ活用・分析
- 機械学習
- ディープラーニング
- 強化学習
- テレワーク・リモートワーク
- マーケテイングオートメーション・MAツール
- マッチング
- レコメンド
- ロボット
- 予測
- 広告・クリエイティブ
- 営業支援・インサイドセールス
- 省人化
- 議事録自動作成
- 配送ルート最適化
- 非接触AI
業態業種別AI導入活用事例
今注目のカテゴリー
AI製品・ソリューションの掲載を
希望される企業様はこちら