画像生成AI「Stable Diffusion」徹底解説!使い方からプロンプトのコツまで

英国のスタートアップが開発した今話題の画像生成AI「Stable Diffusion」をご存知ですか?本記事では「Stable Diffusion」について解説するとともに、「Stable Diffusion」を使って誰でも無料で簡単に画像生成を行うための方法について解説しています。

Stable Diffusionは誰でも無料で使える高性能画像生成AI

Stable Diffusionとは、利用者が入力したテキスト(=プロンプト)を元に画像を生成するAIサービスの一つです。英国のStability AI社が開発を行っており、社名であり「安定」という意味を持つ「Stability(名詞:Stable)」と、「拡散」という意味を持つ「Diffusion」を組み合わせたサービス名となっています。(「拡散」は画像生成の基幹技術に採用されている「拡散モデル(Diffusion Model)」が語源)

Stable Diffusionはオープンソースとなっているため、誰でも無料で使用することができ、公開されたのは2022年とつい最近ですが、現在世界中で利用されている画像生成AIの中で最も有名なものと言っても過言ではありません。

そもそも画像生成AIとは?定義や仕組みを簡単に解説

画像生成AIとは、利用者の入力に対してAIがオリジナルの画像を自動生成するサービスのことを指します。利用者の入力はテキスト(文字)で行うことが一般的で、それはプロンプトと呼ばれています。(インプットに画像を利用するものもあります)

画像生成はディープ・ラーニング(深層学習)と呼ばれる機械学習の一種の手法によって行われます。利用者が入力したテキストはテキストエンコーダによりテキストからベクトルに変換され、画像生成器によってベクトルから画像へ変換されます。具体的な変換方法や画像生成器の仕組みについては画像生成AIごとに異なります。

画像生成AIが注目される最大のポイントは「オリジナルの画像を作成するためのコストが大幅に削減される可能性」を秘めているためです。これまで企業(または個人)は、使用したい画像を権利的にクリアするためには「自ら高いコストを支払い画像を制作したり撮影したりする」または「権利者に対して(画像販売サイトなどを通して)コストを支払った上で画像を使用する」というどちらかが必要でした。

しかし、画像生成AIが生成した画像の権利は利用者に帰属するため、企業(または個人)が求める画像をAIを使って生成することで無料(または格安)で自らが権利を持つ有用な画像を手に入れることができるため、現在非常に注目が集まっています。

Stable Diffusionの使用方法

Stable Diffusionはオープンソースの画像生成AIのため、誰でも無料で使用することができますが、大きく分けてその使用方法は2通りあります。「自分で環境構築をして使用する」「公開されているWebアプリケーションで使用する」の2通りについてそれぞれ説明します。

自分で環境構築をしてStable Diffusionを使用する

自分自身でStable Diffusionを動かすための準備を行う方法です。自分自身のパソコンの中で動かす「ローカル環境構築」と、Google Colabなどのクラウド環境の中で動かす「クラウド環境構築」の2通りの方法があります。

「ローカル環境構築」にはかなりハイスペックなPCを用意する必要がありますが、しっかりと準備すれば高速で画像を生成できたり、セキュリティ上の懸念を大きく改善したりすることが期待できます。一方、Google Colab等のPythonを動かすことのできるツールを利用して「クラウド環境構築」をすることで、パソコンのスペックによらず画像生成AIを動かすことができます。

公開されているWebアプリケーションでStable Diffusionを使用する

自分自身で環境を構築するハードルが高いという人には、Stable Diffusionを動かすことができるWebアプリケーションを利用すると良いでしょう。これは、「Stable Diffusionが使えるHPにアクセスして利用する」と言い換えてもよいです。

有名なWebアプリケーションには次のようなものがあります。

  • DreamStudio
  • Hugging Face
  • Mage.space

次の章ではこれらについて解説していきます。

Stable Diffusionを簡単に利用できるサービス3選

DreamStudio

DreamStudioはStable Diffusionの開発元であるStability AI社が運営をしているため、「公式のWebアプリケーション」と言えるでしょう。DreamStudioの主な特徴は次のとおりです。

  • Stable Diffusionの開発元であるStability AI社が運営
  • 画像生成までのスピードが速く使いやすい
  • 画像のスタイルや縦横比、枚数を指定できるなど高機能
  • 利用するためには無料のアカウント作成が必要
  • クレジット制であり、初回の25クレジットを使い切ると10ドルで1000ドルのクレジットの購入が必要

DreamStudioは「Stable Diffusionの全機能をしっかりと利用してみたい」という人におすすめです。

DreamStudio

Hugging Face

Hugging Faceの主な特徴は次のとおりです。

  • 無料&ログイン無しで利用することができる
  • 回数制限等もなく何度でも画像生成をすることができる
  • プロンプトを入力するだけのシンプルなインターフェイス
  • 細かくパラメータを調整したりすることはできない

Hugging Faceは「とりあえずStable Diffusionを利用してみたい」という人におすすめです。

Hugging Face

Mage.space

Mage.spaceの主な特徴は次のとおりです。

  • 無料&ログイン無しで利用することができる
  • 回数制限等もなく何度でも画像生成をすることができる
  • プロンプトを入力するだけのシンプルなインターフェイス
  • 月額4ドルのベーシックプランと月額15ドルのプロプランがあり、有料プランを利用すると様々なモデルを利用することができる

Mage.spaceは「細かなパラメータ調整等は面倒くさいが、様々なハイクオリティな画像生成をしてみたい」という人におすすめです。

Mage.space

Stable Diffusionで望み通りの画像を生成するための3つのコツ

プロンプトは文章にこだわらず英語で詳細に書く

大前提として、プロンプトは英語で入力してください。日本語などの他言語ではStable Diffusionは正しく認識することができません。(これはChatGPTとは大きく異なる点です)

また、例えば犬の画像を生成する際には「dog」というプロンプトを入力することで実現可能ですが、これで自分自身が望む画像が一発で生成される可能性はほぼ0でしょう。生成したい画像についてできるだけ詳細にプロンプトを入力するべきです。

例えば「サングラスをかけた白色のフレンチブルドッグがサーフボードに座っている画像」を出力したいとします。これを英語で説明すると次のようになります。

Image of a white French bulldog wearing sunglasses sitting on a surfboard.

これをプロンプトに入力すると次のような画像が生成されました。

また基本的なルールとして「文章にこだわらず単語を並べるようにプロンプトを入力する」ほうがベターであることも抑えておく必要があります。複雑な文章であればあるほど、誤った理解をされてしまう可能性があるため、今回であれば次のようなプロンプトのほうがより良いです。

white French bulldog, sunglasses, sitting, surfboard

ポジティブプロンプトとネガティブプロンプトを使いこなす

プロンプトには「ポジティブプロンプト(一般的にプロンプトとだけ表現する場合はポジティブプロンプトのこと)」と「ネガティブプロンプト」があります。

ネガティブプロンプトとは「描写を抑制する指示を入力するプロンプト」です。例えば、サーフボードに乗っている画像がほしいが、実際に波乗りしているシーンではなくあくまでも砂浜でサーフボードに乗っているシーンを描写したいということであれば、ネガティブプロンプトに「ocean, sea」などと入れることでよりイメージした通りの画像を生成できる可能性が高まります。

ポジティブプロンプトのみで一度画像を生成し、自分のイメージとは異なる点をネガティブプロンプトを追加することで抑制するといった使い方が一般的です。

他人のプロンプトを参考にする

どのようなプロンプトであれば、自分の理想とするイメージを生成できるのかについては、初心者の人にとって直感的ではない場合も多いです。そのため、初心者はまずは「他人が生成した画像のプロンプトを参考に、自分の理想に近づけるためにアレンジを加える」という手法をオススメします。

画像生成のためのプロンプトと、それによって出力された画像を共有するサイトがあるので、それらを参考にすると良いでしょう。次のようなサイトが存在します。

Stable Diffusionで画像生成AIを体験してみては?

今回はStable Diffusionを利用した画像生成の方法や、イメージ通りの画像生成を行うためのコツについて解説してきました。公開されているWebアプリケーションを使えば、誰でも簡単に画像生成にチャレンジすることができますので、ぜひトライしてみてください。