電通国際情報サービス、オープンイノベーションラボの比嘉康雄です。 Stable Diffusionシリーズ、今回は、Stable Diffusion 2.0-美少女イラストです。
Stable Diffusionも2.0になったので、もう一度検証し直します。
Stable Diffusionのおすすめコンテンツはこちら。
- Waifu Diffusion 1.3.5_80000
- v2.1 金髪美女写真
- v2.1 美少女アニメ画
- v2.1 AUTOMATIC1111
- v2.0 美少女イラスト
- v1.5 美少女画検証
- 美少女アニメ画改善版
- 美少女を高確率で出す呪文編
- 美少女アニメ画編
- 美少女写真編
- 女性イラスト編
- 長い呪文は切り捨てられる編
- AUTOMATIC 1111のインストール
- AUTOMATIC 1111のセッティング
- 呪文の基本ルール
- 美少女イラストの呪文
- v1.5
- まとめ
- 仲間募集
- Stable Diffusionの全コンテンツ
AUTOMATIC 1111のインストール
Stable Diffusion 2.0
を実行する環境として、AUTOMATIC 1111
を使います。
AUTOMATIC 1111
は、Stable Diffusion
をGoogle Colab
直接ではなく、UI
経由で実行できるようにしています。似たような機能のものはいくつかありますが、AUTOMATIC 1111
が最も人気があるので、今回からこれを使います。
Google Colab
で動かすためのノートブックはこちらになります。
このノートブックを実行すると、下の方に
Running on public URL: https://2c76db068be0e79a.gradio.app
のようなURLのリンクが表示されるので、クリックしましょう。
Colab Pro
の通常メモリでは、メモリが足りなくなることがありました。そのような場合は、Google Drive
にコピーしてハイメモリにしましょう。
AUTOMATIC 1111のセッティング
パラメータは以下のようになります。
- Sampling Steps: 50
- Sampling Method: DPM2
- Width: 768
- Height: 768
- CFG Scale: 7.5
- Seed: -1
Sampling Stepsは、デフォルトの20
だと少ないので、50
くらいにしておきましょう。
Sampling MethodはDPM2
をお勧めしますが、DDIM
も悪くはありません。それ以外は、描く対象によりますが、あまりお勧めしません。
Width
とHeight
は768
をお勧めします。Stable Diffusion 2.0
のモデルの768-v-ema.ckpt
は、768
用のためです。512
だとかを使うと画像が崩れることがあります。
CFG Scale
は入力した呪文にどれだけ近い画像を生成するかのパラメータです。デフォルトの7
でも問題ありませんが、僕はなんとなく7.5
を指定しています。
呪文の基本ルール
以前よりも僕自身、呪文(prompt)の基本ルールがわかってきたので、お伝えします。経験則的な側面が強いですが、たぶん、あっていると思います。
- トークンは75まで。
- カンマ(,)は必要がない。カンマもトークンの一つとしてカウントされるので、ないほうが良い。
- 前の方にあるトークンの方が出力結果に与える影響が大きい。
- 冠詞(a, an, theなど)は必要がない。
- 近くにあるトークンは影響を受ける。後ろにあるトークンも前のトークンに影響を与える。
- トークンとトークンの間のトークン数が多くなると、トークンの影響は少なくなる。
呪文はトークンに分解されます。トークンは基本的には、単語だと思って大丈夫ですが、Stable Diffusion
が知らないトークンは、一つの単語が複数のトークンに分解されることもあります。例えば、pixiv
は、pi
とxiv
の2つのトークンになります。
「後ろにあるトークンも前のトークンに影響を与える」というのは、これまで、なんとなく感じていたけど、言語化できていなかった部分ではないでしょうか。
例えば、apple on table
だと赤いリンゴがほとんどです。しかし、apple on yellow table
だと黄色のりんごになる確率が増えます。
トークンとトークンの間のトークン数が多くなると、トークンの影響は少なくなります。
例えば、apple on yellow table
だと黄色になるリンゴもありますが、apple on a a a a a a a a a a a a a a a a a a yellow table
だと、黄色になるリンゴの確率はかなり減ります。
美少女イラストの呪文
それでは、呪文の基本ルールをふまえた、Stable Diffusion 2.0
で検証済みの美少女イラストの呪文を紹介します。
beautiful princess beautiful face beautiful hair beautiful clothes artstation fantasy scene fantasy composition fantasy lighting octane render
閲覧用改行版
beautiful princess beautiful face beautiful hair beautiful clothes artstation fantasy scene fantasy composition fantasy lighting octane render
出力結果の例です。
これは、厳選したものではなく、連発できます。それでは、呪文の中身を解説しましょう。
beautiful princess
これまで、美少女を描画するときは、beautiful girl
を指定していたのですが、これをbeautiful princess
に変えました。これがかなり効果的で、美少女になる確率がかなり高くなりました。
beautiful face
美少女率を上げるためには、beautiful face
はあったほうが良いです。
beautiful hair beautiful clothes
この呪文は、それほど大した意味はないのですが、前のface
と次のartstation
との距離をあけるために指定しています。artstation
はアートの投稿サイトなので、face
とartstation
が近くにあると、face
に過剰に色がつくなどartstation
の影響をうけることがあります。
hair
とclothes
は、artstation
の影響を受けてもそれほど問題はないので、緩衝材にぴったりです。
artstation
artstation
は、art
(イラスト)の投稿サイトです。artstation
を指定することで、出力結果がイラストになります。
また、artstation
を指定することで、出力される画像のクオリティが上がります。
fantasy scene fantasy composition fantasy lighting
シーン(scene)、構図(composition)、ライティング(lighting)は指定しておきましょう。指定しないと人物だけの単純な画像になることがあります。
修飾語は好みで構いません。fantasy
は美少女と相性の良い修飾語です。princess
、face
、hair
、clothes
などに悪影響を与えることもありません。
octane render
octane render
を指定すると画像が多少立体的になります。二次元が好きな方は外してください。
v1.5
v1.5で下記のパラメータで実行してみました。Width
とHeight
を512
に変えただけです。
- Sampling Steps: 50
- Sampling Method: DPM2
- Width: 512
- Height: 512
- CFG Scale: 7.5
- Seed: -1
v1.5でも、良い結果が連発できました。呪文が改善されたことと、Sampling Method
をDDIM
からDPM2
にしたことが良い結果につながったのかもしれません。
比べてみるとv2.0のほうが、質感が増しているのがわかります。
v1.5の出力結果はこちら。
まとめ
今回は、Stable Diffusion 2.0
の美少女イラストの呪文を紹介しました。
v1.4
とv1.5
の違いはあまりなかったのですが、v2.0
では画像の質感が増し、明らかに良くなったと思います。みなさんもぜひ試してください。
仲間募集
私たちは同じグループで共に働いていただける仲間を募集しています。
現在、以下のような職種を募集しています。
Stable Diffusionの全コンテンツ
- 人物写真編
- レンズ編
- 画像タイプ編
- 美少女アニメ画編
- 美少女写真編
- 女性イラスト編
- 美しい夜空を見渡す男編
- 魅惑的な女アニメ画(トゥーンレンダリング)編
- 美少女を高確率で出す呪文編
- 長い呪文は切り捨てられる編
- 蒸気機関が高度に発達したレトロなアニメ(スチームパンク)の世界観編
- A as Bの呪文による画像合成編
- かわいい動物の擬人化編
- バベルの塔のイラスト編
- TPU版の使い方
- 美少女アニメ画改善版
- v1.5 美少女画検証
- 東京タワーの写真
- 折り紙合体変形ロボ
- v2.0 美少女イラスト
- v2.1 AUTOMATIC1111
- v2.1 美少女アニメ画
- v2.1 金髪美女写真
- Waifu Diffusion 1.3.5_80000
執筆:@higa、レビュー:Ishizawa Kento (@kent) (Shodoで執筆されました)