生成AI

AIエージェント
生成AI
ChatGPT連携サービス
AI受託開発
対話型AI -Conversational AI-
ボイスボット
バーチャルヒューマン
教師データ作成
AI研究開発
通訳・翻訳
声紋認証
機密情報共有・管理
契約書管理システム
ワークステーション
FAQシステム
AIカメラ
生体認証
インボイス制度対応システム
データセットの収集・購入
コールセンター
人事・総務向け
インバウンド対策
コンバージョンアップ
KYT・危険予知で労働災害防止
無料AI活用
顧客リスト自動生成
ロボットで自動化
LINE連携
セキュリティー強化
テレワーク導入
AI学習データ作成
配送ルート最適化
非接触AI
受付をAIで自動化、効率化
AIリテラシーの向上サービス
日本語の手書き文字対応AI-OCR
Windows作業の自動化RPAツール
リスク分析AIで与信管理
紙帳票仕分けAI-OCRサービス
サプライチェーン
AIコンサルティング
最終更新日:2025/01/30
Stable Diffusionのモデルとは?
仕事でStable Diffusionを使っているので、ニーズに合った画像を手早く生成する必要があるけれど、なかなかうまくいかずに困っている人はいませんか?
Stable Diffusionに画像を生成しなければならない背景や、細かい設定をプロンプトだけで理解してもらうのはなかなか難しいことかもしれません。
この記事では、Stable Diffusionで自分の要望通りの画像を生成するのに役立つ、モデルについて詳しくご紹介します。
Stable Diffusionについて詳しく知りたい方はこちらをご覧ください。
Stable Diffusionとは?話題の画像生成AIの使い方・初心者向けのコツも徹底解説!
Stable Diffusionのモデルとは、AIが学んだことをもとに新しい画像を作り出すための仕組みです。
モデルはAIの脳を強化する役割を持ち、PCに新しいCPUを追加するのと似た働きをしてくれます。
Stable Diffusionのモデルは人間の脳をまねて作られたニューラルネットワークという仕組みを持ち、次の手順で画像を生成します。
| 項目 | 概要 |
| パターン認識で学習する | ・たくさんの画像を見て特徴を学習する ・例えば、猫の画像を見たら共通する「ひげがある」「耳が2つ」「毛におおわている」といったパターンをつかむ(「パターン認識」と呼ぶ) |
| 層の通過 | ・画像が数式に変換されて層を通過する ・最初の層では画像の簡単な特徴(色、形など)をとらえ、通過するにつれて複雑な特徴をとらえる |
| 潜在空間を操作して新しい画像を作る | ・潜在空間は画像の特徴が圧縮された数式のようなもの ・Stable Diffusionはランダムなノイズ(ランダムで規則性のないパターンや色の集まり)を、学習した特徴を使って変換していき新しい画像を生成する(ディフュージョンモデルというアルゴリズムがこの役割を担う) |
モデルを導入するとStable Duffusionの脳はより多くの情報を覚え、画像を生成する能力が高まるのです。
これにより、さらに複雑で美しい画像の生成が可能となります。
Stable Diffusionのモデルの種類には、次のようなものがあります。
| モデルの種類 | 特徴 | 用途 |
| ベースモデル | ・Stable Diffusionの基礎になるモデル ・学習済みのデータセットをもとに、幅広い用途で画像生成ができる |
・風景 ・ポートレート ・ファンタジーアート |
| ファインチューニングモデル | ・特定のテーマやスタイルに特化して調整されたモデル | ・アニメ風イラスト ・リアルな写真風画像 |
| 特化型モデル | ・特定の要素(例:キャラクターの顔や背景デザインなど)に特化して作られたモデル | ・背景デザインや特定のスタイルに特化した画像を生成する |
| マルチモーダルモデル | ・スケッチや写真などの画像を入力に使うことを前提に作られたモデル | ・テキストと画像の入力で、より具体的なイメージを生成する |
| 特殊条件モデル | ・特定の条件(ポーズや色調など)に基づいて画像生成するためのモデル | ・キャラクターのポーズや光源などをコントロールして特定の構図を作れる |
初心者の人はまずベースモデルから使い始め、慣れてきたら自分がどのような画像を生成したいのかに合わせて選ぶのがおすすめです。
Stable Diffusionのモデルをダウンロードする方法を、Civitaiからのダウンロード方法、Hugging faceからのダウンロード方法の2つにわけてご紹介します。
Civitaiからモデルをダウンロードする方法は以下の通りです。
①Civitaiのトップページにアクセスする

画像出典:Civitai公式ホームページ
②「Models」のタブをクリックし、モデルの名前がわかっていれば画面上部の検索窓で検索する

画像出典:Civitai公式ホームページ
③モデルの名前がわからない場合は画面右上の「Filters」をクリックし条件を絞って検索する

画像出典:Civitai公式ホームページ
④サムネイルをクリックするとモデルの内容が記載されたページにうつるので、画面右側のアイコンを9yリックして制限事項を確認する

画像出典:Civitai公式ホームページ
⑤画面右側にあるダウンロードボタンをクリックする

画像出典:Civitai公式ホームページ
商用利用を目的としている人は、権利侵害をしないようにするためにも制限事項の確認を忘れないようにしましょう。
Civitaiについてについて詳しく知りたい方はこちらをご覧ください。
Civitaiとは?登録手順からモデルのダウンロード方法まで詳しく解説
Hugging faceからモデルをダウンロードする方法は以下の通りです。
①Hugging faceのトップページにアクセスする

画像出典:Hugging face公式ホームページ
②画像上部のメニューの中から「Models」を選択する

画像出典:Hugging face公式ホームページ
③検索窓に「Stable Diffusion」と入力して検索する

画像出典:Hugging face公式ホームページ
④表示されたモデルをクリックすると詳細が表示されるので利用条件、サンプル画像、インストール方法を確認する

商用利用可能かどうかも詳細ページのLicence欄で確認できるので、必ず目を通しましょう。
Stable Diffusionのモデルでおすすめのものを種類別にご紹介します
ベースモデルのおすすめは次の2つです。

画像出典:Civitai 「Stable Diffusion v1.5」
CivitaiでダウンロードできるStable Diffusion v1.5はStable Diffusionの基礎となるベースモデルで、高解像度で幅広い画像生成をすることができます。
Stable Diffusion v1.5は風景、ポートレート、ファンタジーアートなどの生成に適しています。
ギャラリーでもリアル系、アニメ系どちらでも細やかで美しい仕上がりの画像が多いのが特徴的です。
Stable Diffusion v1.5は初心者でmさまざまなジャンルの画像を試しに生成してみたい人におすすめです。
参考:Civitai「Stable Diffusion v1.5」

画像出典:Hugging face「Stable_Diffusion_2.1_base」
Hugging faceでダウンロードできるStable Diffusion 2.1は、より高品質な画像生成をするために改善されたベースモデルです。
Stable Diffusion 2.1は、詳細で美しい風景画像やアートワークに強みがあります。
Stable Diffusion 2.1は初心者で、アート系の画像生成をしたい人におすすめです。
参考:Hugging face「Stable_Diffusion_2.1_base」
ファインチューニングモデルのおすすめは次の2つです。

画像出典:Civitai 「Realistic Vision V6.0 B1」
CivitaiでダウンロードできるRealistic Visionは、写真風画像の生成に特化したファインチューニングモデルです。
Realistic Visionは人物や風景の生成にその強みを発揮します。
ギャラリーでは人物なら髪の毛や服のしわ、風景なら光の当たり方による微細な色の違いまで鮮明に描き出された画像が多いのが特徴的だと言えるでしょう。
Realistic Visonはリアルさにこだわって画像生成をした人におすすめです。
参考:Civitai 「Realistic Vision V6.0 B1」

画像出典:Hugging face 「anything-v3.0」
Hugging faceでダウンロードできるAnything V3は、アニメ風イラストやキャラクターを生成するためにファインチューニングされたモデルです。
Anything V3にアクセスするためには、連絡先情報(メールアドレスとユーザー名)をリポジトリの作成者と共有するのに同意する必要があるので注意しましょう。
Anything V3はアニメ風画像のクオリティーを上げ、キャラクターデザインやイラスト制作を効率化したい人におすすめです。
参考:Hugging face 「anything-v3.0」
特化型モデルのおすすめは次の2つです。

画像出典:Civitai 「Face Restoration XL」
Civitaiでダウンロードできるface Restorationは、人物の顔やポートレートに特化したモデルで、顔の表情や特徴をリアルに再現できます。
具体的には、プロンプトで人種や顔に表れている感情を指定するとそれに合った人物を生成できるでしょう。
Face Restorationはポートレートをよりリアルに生成したい人におすすめです。
参考:Civitai 「Face Restoration XL」

画像出典:Hugging face 「Kotajiro/yayoi_mix」
Hugging faceでダウンロードできるyayoi_mixは、リアル系の美しい日本人女性の生成に特化したモデルです。
モデルの説明部分で禁止事項が以下のように定められているので、必ず目を通しておきましょう。
yayoi_mixは高品質な日本人女性の画像を生成したい人におすすめです。
参考:Hugging face 「Kotajiro/yayoi_mix」

画像出典:Github 「BLIP」
マルチモーダルモデルのおすすめは、GithubでダウンロードできるBLIP(Bootstrapped Language-Image Pre-training)です。
BLIPをStable Diffusionに導入すると、以下のことができるようになります。
キャプション生成や質問応答を試せるサンプルコードが提供されているため、一度お試し利用をしてみるのもよいでしょう。
BLIPは画像から自然なテキストを生成したり、テキストから画像の詳細を推測したりできるため、Stable Diffusionにおいて画像とテキストの連携をスムーズにしたい方におすすめです。
参考:Github「BLIP」

画像出典:Civitai 「ChilloutMixss3.0」
特殊条件モデルのおすすめはCivitaiでダウンロードできるchilloutmixです。
リアル系画像にアニメ風画像の要素を程よく加えることができるモデルで、リアルな人物を生成すると目が大きく描かれるなどアニメの特徴を持った画像になります。
商用利用も可能なので、ビジネスから趣味まで幅広いシーンで使用できるモデルだと言えるでしょう。
chilloutmixは画像にリアルさとファンタジー感を両立させたい人におすすめです。
Stable Diffusionについて詳しく知りたい方はこちらをご覧ください。
Stable Diffusionとは?話題の画像生成AIの使い方・初心者向けのコツも徹底解説!
Stable Diffusionのモデルとは、AIの脳により多くの情報を覚えさせ画像を生成する能力を高めるためのツールです。
Stable Diffusionのモデルはベースモデル、ファインチューニングモデル、特化型モデル、マルチモーダルモデル、特殊条件モデルの5種類に分類でき、CivitaiやHugging face、Githubなどでダウンロードできます。
この記事も参考にし、自分のニーズに合ったモデルを見つけてみてください。
Stable Diffusionについて詳しく知りたい方はこちらをご覧ください。
業務の課題解決に繋がる最新DX・情報をお届けいたします。
メールマガジンの配信をご希望の方は、下記フォームよりご登録ください。登録無料です。
AI製品・ソリューションの掲載を
希望される企業様はこちら