DXを推進するAIポータルメディア「AIsmiley」| AI製品・サービスの比較・検索サイト
03-6452-4750 10:00〜18:00 年末年始除く

Stable Diffusion「CFG Scale」とは?その意味やおすすめ設定を解説

最終更新日:2025/06/05

CFG Scaleの意味やおすすめ設定

Stable Diffusionで魅力的な画像を生成する際、CFG Scaleの設定が大きな影響を与えることをご存知ですか?このパラメーターは、AIがあなたの指示にどれだけ忠実に従うか、あるいはどれだけ創造性を発揮するかを決定します。

本記事では、CFG Scaleの基本概念から実践的な活用法まで、画像生成の質を劇的に向上させるための知識を解説します。Stable Diffusionを使いこなしたいクリエイターやAI画像生成に興味がある方にとって、理想的な画像を効率的に生み出すための重要な鍵となるでしょう。

CFG Scale(Classifier-Free Guidance Scale)とは


CFG Scaleは「Classifier-Free Guidance Scale」の略称で、Stable Diffusionにおける最も重要なパラメーターの一つです。このスケールは、AIがプロンプト(テキスト指示)にどれだけ忠実に従うかを決定する数値であり、低い値ではAIの創造性が高まり、高い値ではプロンプトへの忠実度が増します。

Stable Diffusionの画像生成プロセスにおいて、このパラメーターは生成される画像の品質と特性を大きく左右するため、適切な設定を見つけることが重要です。初心者の方は7〜12の範囲から始めることをおすすめします。

Stable Diffusionの全容については、以下の記事でも詳しく解説していますので、ぜひご覧ください。
関連記事:Stable Diffusionとは?話題の画像生成AIの使い方・初心者向けのコツも徹底解説!

Stable Diffusionにおけるパラメーターの役割

Stable Diffusionでは、CFG Scaleはユーザーインターフェースの中心的な位置に配置されており、多くの場合スライダー形式で簡単に調整できるようになっています。このパラメーターは他の設定値と密接に関連しており、特にSampling stepsやSamplerの選択と組み合わせることで最終的な画像の品質が決まります。通常1から30の範囲で行われ、WebUIでは中央部分に表示されることが多いです。

操作方法は非常に直感的で、スライダーを左右に動かすか、直接数値を入力することで調整できます。このパラメーターは生成プロセスの各ステップにおいて、ノイズ除去の方向性をプロンプトに基づいてどれだけ強く誘導するかを制御しており、画像生成のバックボーンとも言える重要な役割を担っています。

プロンプト忠実度と創造性のバランスを決める要素

CFG Scaleの値は、AIがプロンプトの指示にどれだけ忠実に従うか、あるいはどれだけ創造性を発揮するかのバランスを決定します。

例えば「青い空と赤いバラ」というプロンプトでは、低CFGでは雰囲気重視の柔らかい表現に、高CFGでは鮮やかすぎる色彩になりがちです。このバランスはプロンプトの複雑さ、生成したい画像のスタイル、使用するモデルによっても変わります。理想的な設定を見つけるには、同じプロンプトで異なるCFG値を試し、自分の求める表現に最も近い値を選ぶことが重要です。

CFG Scaleの仕組みと効果


CFG Scaleは画像生成の背後で動作する重要な制御メカニズムです。技術的には、条件付き拡散モデルと無条件拡散モデルの出力を特定の比率で混合することで機能します。

この仕組みにより、AIはノイズから画像を生成する各ステップで、どれだけプロンプトの指示に従うべきかを決定しています。実際の処理では、CFG Scaleの値に基づいて2つの予測結果を適切に重み付けし、最終的な画像の特性を形作っているのです。

数値変更によって変わる画像の特徴

CFG Scaleの数値を変更すると、生成される画像の特性が大きく変化します。低値(1~4)では創造性が高まりますが、プロンプトとの一致度は低下します。多くのユーザーに適した中間値(5~12)ではプロンプトの忠実さと創造性のバランスが取れ、自然で魅力的な画像が生成されます。

高値(13~20)ではプロンプトへの忠実度が上がり細部表現が向上しますが、色彩や細部が不自然になることも。非常に高い値(21~30)では過度な忠実さにより自由度が低下し、特徴が異常に強調された不自然な歪みが発生しやすくなります。

値の選択によって同じプロンプトでも大きく印象が変わるため、目的に応じた適切な設定が重要です。

CFG Scale値の範囲 特徴と効果
低い値 (1~4) • プロンプトへの忠実度が低い
• 創造性やランダム性が増加
• モデルがより自由な解釈が可能
中間値 (5~12) • プロンプトとの適度なバランス
• 魅力的な内容で品質の高い画像
• 自然で柔軟な出力
高い値 (13~20) • プロンプトへの忠実度が高い
• 細部まで忠実に表現
• 正確性と写実性の重視
非常に高い値 (21~30) • プロンプトへの過度な忠実さ
• 自由度の低下
• 異常に強調された特徴

Stable Diffusionの画像生成プロセスとの関係

Stable Diffusionの画像生成プロセスにおいて、CFG Scaleは非常に重要な役割を担っています。このパラメーターは、ノイズから徐々に画像を生成していく拡散過程の各ステップで作用します。具体的には、AIがプロンプトなしで予測した内容と、プロンプトを考慮して予測した内容を特定の比率で混合させる働きをします。この比率がまさにCFG Scaleの値なのです。

例えば、CFG Scale=7の場合、「プロンプトなし予測×1」と「プロンプトあり予測×7」を組み合わせた結果が次のステップに反映されます。この計算式(結果=無条件予測+(条件付き予測-無条件予測)×CFG Scale)によって、プロンプトの影響力が調整されるのです。高いCFG Scale値ではプロンプトの要素が強調され、低い値では拡散モデル本来の創造性が発揮されます。このバランスを理解することで、目的に合った画像生成が可能になります。

理想的なCFG Scale設定の見つけ方


理想的なCFG Scale設定を見つけるには、まず自分の目的を明確にすることが重要です。写実的な画像を生成したい場合は、一般的に高めの値(15〜30)が適しています。これは高いCFG値がプロンプトへの忠実度を高め、テキストの指示通りの要素が画像に反映されやすくなるためです。

一方、より創造的で予想外の表現を求める場合は、低めの値(5〜10)を試してみましょう。AIの「想像力」が発揮され、意外性のある結果が得られることがあります。多くのユーザーにとって、10〜20の範囲が汎用的なバランスポイントとなっています。

最適な設定を見つけるコツは、同じプロンプトで複数の値を試し、結果を比較することです。自分の作品に合った「お気に入りの数値」を見つけることで、作業効率が大幅に向上するでしょう。

CFG Scale設定の改善と調整方法


CFG Scale設定を効果的に改善するには、生成したい画像の特性を明確に理解することが重要です。まず低い値(5-8)から始めて徐々に調整し、結果を比較しながら最適値を見つけていきましょう。プロンプトの複雑さに応じて値を変えることも効果的で、詳細なプロンプトには高めの値が適していることが多いです。

また、生成目的によって設定を変えることも重要です。写実的な画像には高めの値、創造的な表現には低めの値が向いています。次のセクションでは具体的な画質向上のための調整法について詳しく解説します。

画質向上のためのパラメーター調整法

画質向上のためには、CFG Scaleを段階的に調整することが効果的です。まず、7〜9程度の中間値から始め、生成された画像のノイズやぼやけ具合を確認しましょう。ノイズが多い場合はCFG Scaleを1〜2ほど上げ、逆に不自然さが目立つ場合は値を下げていきます。特に顔や手などの細部が崩れている場合は、CFG Scaleを12前後まで上げると改善することがあります。また、画質向上には他のパラメーターとの組み合わせも重要です。

例えば、Sampling stepsを30以上に設定しながらCFG Scaleを調整すると、より細かなディテールが表現できます。さらに、Negative promptを活用してノイズ除去を指定しつつ、CFG Scaleを微調整することで、クリーンで高品質な画像生成が可能になります。最適な設定は被写体や画風によって異なるため、0.5刻みで値を変えながら比較検証することをおすすめします。

プロンプト設計との組み合わせ方

CFG Scaleとプロンプト設計は密接に関連しており、両者を適切に組み合わせることで画像生成の質が大幅に向上します。プロンプトの順序は重要な要素で、最初に記述した要素ほど画像に強く反映される傾向があります。例えば「赤いドレスを着た女性、森の中」と「森の中、赤いドレスを着た女性」では、CFG Scale値が高いほどその順序による影響が顕著になります。また、プロンプトの詳細度によって最適なCFG Scale値は変動します。

詳細なプロンプトには7〜9程度の中程度のCFG値が適している一方、シンプルなプロンプトでは10以上の高い値が効果的な場合があります。これは詳細なプロンプトが既に多くの制約を含んでいるため、過度なCFG値が不自然な画像を生み出す可能性があるためです。重みづけ機能(括弧や数値指定)を活用する場合は、CFG Scaleをやや低めに設定すると、各要素のバランスが取れた自然な画像が得られやすくなります。

Sampling stepsとの相互作用の最適化

CFG ScaleとSampling stepsは密接に関連しており、両者のバランスが画像品質を左右します。Sampling stepsは生成過程の反復回数を決定し、高い値ほど細部が洗練されますが、処理時間も増加します。例えば、CFG Scaleが高い場合(12以上)は、Sampling stepsも30以上に設定すると細部表現が向上します。逆に低いCFG Scale(7以下)では、20〜25程度のStepsでも十分な結果が得られることが多いです。

実用的なアプローチとしては、まずSampling stepsを20に固定し、CFG Scaleを7から徐々に調整して理想的な値を見つけた後、必要に応じてStepsを増減する方法が効率的です。特に複雑なシーンやディテールが重要な場合は、両パラメーターを高めに設定することで、生成時間は長くなりますが、より精密な画像が得られます。

CFG Scale活用の実践的なテクニック


CFG Scaleを実際の制作フローに組み込むための実践的なテクニックは、作品の質を大きく左右します。まず基本として、目的に応じた数値設定を意識しましょう。写実的な人物画には7〜9、抽象的なアート作品には5前後、精密な建築物には10以上など、ジャンルごとに最適値が異なります。また、複数の数値でテスト生成し比較検討する習慣をつけることで、微妙な違いを把握できるようになります。

拡張機能との連携では、Dynamic Promptsなどを活用して異なるCFG値での一括生成が効率的です。さらに、プロンプトの長さや複雑さに応じてCFG値を調整する「バランシング法」も覚えておくと良いでしょう。これらのテクニックを組み合わせることで、Stable Diffusionの可能性を最大限に引き出せます。

拡張機能との連携による精度向上

Stable Diffusionの可能性を最大限に引き出すには、CFG Scale設定と拡張機能の連携が鍵となります。特に注目すべき拡張機能として、SD WebUI Tag Autocompleteはプロンプト入力を効率化し、適切なCFG値の選択をサポートします。Multi Diffusionは複数の生成結果を組み合わせる際、中間的なCFG値(7〜9)で最も調和のとれた結果を生み出します。

画像の構図や姿勢を制御するControlNetは、CFG値を10〜12に設定することで指示の忠実度を高めつつ、創造性も維持できます。また、Adetailerは顔や手などのディテールを自動修正しますが、低すぎるCFG値では修正効果が薄れるため、最低7以上の設定が推奨されます。

これらの拡張機能を活用する際は、まず標準的なCFG値(7)で生成し、結果を見ながら徐々に調整していくアプローチが効果的です。拡張機能ごとの特性を理解し、CFG Scaleと組み合わせることで、生成画像の品質と意図への忠実度を大幅に向上させることができます。

拡張機能 概要・役割
SD WebUI Tag Autocomplete プロンプトの入力を支援する拡張機能
Multi Diffusion 画像の高精度化を実現する拡張機能
ControlNet 他の画像の構図を真似できる拡張機能
Adetailer イラストの顔や手を自動認識して補正する拡張機能

トラブルシューティングと問題解決アプローチ

Stable Diffusionで思い通りの画像が生成されない場合、まずCFG Scaleの値を見直すことが重要です。プロンプトが十分に反映されていない場合は、CFG Scaleを7から9程度に上げてみましょう。逆に画像が不自然で硬い印象になる場合は、値を5程度に下げると改善することがあります。

特定のポーズや要素が反映されない問題では、CFG Scaleを上げつつ、プロンプトの該当部分を強調する括弧やウェイト設定を併用すると効果的です。

また、画質が粗い場合はSampling stepsを増やしながらCFG Scaleを調整するアプローチが有効です。生成された画像に不自然な歪みが生じる場合は、CFG Scaleを下げつつNegative promptを強化することで解決できることが多いです。試行錯誤の過程でパラメーターの変化を記録しておくと、自分だけの最適な設定パターンを見つけることができます。

まとめ

CFG Scaleはプロンプト忠実度と創造性のバランスを決める重要なパラメーターです。理想的な設定は7〜12の範囲が多いですが、目的に応じて調整が必要です。プロンプトの複雑さやSampling stepsとの相互作用も考慮し、拡張機能と組み合わせることで精度向上が可能です。Stable Diffusionを使いこなすためには、CFG Scaleの特性を理解し、実験を重ねながら最適な設定を見つけることが成功への鍵となります。

画像生成AI のサービス比較と企業一覧

AIsmiley編集部

株式会社アイスマイリーが運営するAIポータルメディア「AIsmiley」は、AIの専門家によるコンテンツ配信とプロダクト紹介を行うWebメディアです。AI資格を保有した編集部がDX推進の事例や人工知能ソリューションの活用方法、ニュース、トレンド情報を発信しています。

・Facebookでも発信しています
@AIsmiley.inc
・Xもフォローください
@AIsmiley_inc
・Youtubeのチャンネル登録もお願いいたします@aiaismiley1345

メルマガに登録する

AIサービス
生成AI
画像生成AI
DXトレンドマガジン メールマガジン登録

業務の課題解決に繋がる最新DX・情報をお届けいたします。
メールマガジンの配信をご希望の方は、下記フォームよりご登録ください。登録無料です。

お名前 - 姓・名

お名前を入力してください

メールアドレス

メールアドレスを入力してください

AI・人工知能記事カテゴリ一覧

今注目のカテゴリー

生成AI

ChatGPT連携サービス

チャットボット

AI-OCR

生成AI

ChatGPT連携サービス

チャットボット

AI-OCR

AI活用のご相談したい企業様はこちら

03-6452-4750

AI製品・ソリューションの掲載を
希望される企業様はこちら