電通国際情報サービス、オープンイノベーションラボの比嘉康雄です。 Stable Diffusionシリーズ、今回のテーマは、Stable Diffusion 2.1-金髪美女写真です。
Stability AI
がPrompt Bookという呪文の解説スライドを出しているので、それを研究します。今回は、Prompt Book
のPhotorealism
(写真のようなリアルな描写法)の金髪美女の呪文を解説します。解説スライドでは、14, 15ページの内容になります。
Prompt Book
は更新が入っているようなので、最新版では、内容が変わっている可能性もありますが、本質的な部分は変わっていないはずです。
Stable Diffusionのおすすめコンテンツはこちら。
- Waifu Diffusion 1.3.5_80000
- v2.1 金髪美女写真
- v2.1 美少女アニメ画
- v2.1 AUTOMATIC1111
- v2.0 美少女イラスト
- v1.5 美少女画検証
- 美少女アニメ画改善版
- 美少女を高確率で出す呪文
- 美少女アニメ画
- 美少女写真
- 女性イラスト
- 長い呪文は切り捨てられる
- AUTOMATIC1111のインストール
- AUTOMATIC1111のセッティング
- 金髪美女写真の出力結果
- 金髪美女写真の通常呪文
- 金髪美女写真のネガティブ呪文
- 仲間募集
- Stable Diffusionの全コンテンツ
AUTOMATIC1111のインストール
Stable Diffusion 2.1
を実行する環境として、AUTOMATIC1111
を使います。
AUTOMATIC1111
は、Stable Diffusion
をGoogle Colab
直接ではなく、UI
経由で実行できるようにしています。似たような機能のものはいくつかありますが、AUTOMATIC1111
は人気が高く、情報量も多いのでおすすめです。
Google Colab
で動かすための公式のノートブックはこちらになります。
このノートブックを実行すると、下の方に
Running on public URL: https://2c76db068be0e79a.gradio.app
のようなリンクが表示されるので、クリックしましょう。
AUTOMATIC1111のセッティング
パラメータは以下のようになります。
- Sampling Steps: 50
- Sampling Method: DPM2
- Width: 768
- Height: 768
- CFG Scale: 7.5
- Seed: -1
Sampling Stepsは、デフォルトの20
だと少ないので、50
くらいにしておきましょう。
Sampling MethodはDPM2
をお勧めしますが、DDIM
も悪くはありません。
Width
とHeight
は768
をお勧めします。今回使っているモデルは、768
用のためです。512
だとかを使うと画像が崩れることがあります。
CFG Scale
は入力した呪文にどれだけ近い画像を生成するかのパラメータです。デフォルトの7
でも問題ありませんが、僕はなんとなく7.5
を指定しています。
金髪美女写真の出力結果
金髪美女写真の出力結果の例です。
金髪美女写真の通常呪文
金髪美女写真の通常呪文は次のようになります。
portrait of a blonde woman in a white dress posing for a picture, tumblr, digital art, glowing with colored light, ethereal lighting, forest ray light, taken in 2022, handsome girl, brooke ashling, diffused natural skin glow
見やすいように改行すると次のようになります。
portrait of a blonde woman in a white dress posing for a picture, tumblr, digital art, glowing with colored light, ethereal lighting, forest ray light, taken in 2022, handsome girl, brooke ashling, diffused natural skin glow
個々の呪文を解説しましょう。
portrait of a blonde woman
portrait of a blonde woman
は、「金髪女性の肖像画」という意味です。
in a white dress
in a white dress
は、「白いドレスを着て」という意味です。
posing for a picture
posing for a picture
は、「写真撮影のためにポーズを取る」という意味です。正面から撮った棒立ちの写真はつまらないので、この呪文は覚えておきましょう。
tumblr
tumblr
は、SNSの一つです。指定するとなんとなくクオリティが上がる気がする呪文です。たぶん、外してもそれほど違いはないと思います。
digital art
digital art
は、「デジタルアート」という意味です。たぶん、外してもそれほど違いはないと思います。
glowing with colored light
glowing with colored light
は、「色付きの光で輝く」という意味です。この効果は、金髪女性に影響します。
ethereal lighting
ethereal lighting
は、「優美な照明」の意味です。
forest ray light
forest ray light
は、「森の光」という意味です。木々の間から木漏れ日が見えるような効果になることが多いです。単なるforest
よりずっと美しくなるので、この呪文は覚えておきましょう。
taken in 2022
taken in 2022
は、「2022年に撮られた」という意味です。たぶん、外してもそれほど違いはないと思います。
handsome girl
handsome girl
は、「キリッとして目鼻立ちの整った少女」の意味です。
brooke ashling
brooke ashling
は、人の名前のような気がしますが、なんの意味があるのかわかりません。たぶん、外してもそれほど違いはないと思います。
diffused natural skin glow
diffused natural skin glow
は、「分散した自然な肌の輝き」の意味です。
金髪美女写真のネガティブ呪文
通常呪文を打ち消すのがネガティブ呪文です。
金髪美女写真のネガティブ呪文は次のようになります。
gingerbread candy village, on a plate in a busy diner, ice - t, drinking beer and laughing, cartoon, 1990s cartoon, black show room, breaking bad scene, animal - shaped bread, broken down grey wall, cheese and pepperoni, black hair, duplicat
見やすいように改行すると次のようになります。
gingerbread candy village, on a plate in a busy diner, ice - t, drinking beer and laughing, cartoon, 1990s cartoon, black show room, breaking bad scene, animal - shaped bread, broken down grey wall, cheese and pepperoni, black hair, duplicate
個々の呪文を解説しましょう。
gingerbread candy village, on a plate in a busy diner
結構意味不明ですが、「繁盛している食堂の皿の上のお菓子」くらいの意味でしょうか。通常呪文とほとんど関係がないので、たぶん、外してもそれほど違いはないと思います。
ice - t
これも意味不明ですが、「アイスティー」のことなのかもしれません。通常呪文とほとんど関係がないので、たぶん、外してもそれほど違いはないと思います。
drinking beer and laughing
drinking beer and laughing
は、「ビールを飲んで笑う」の意味です。通常呪文とほとんど関係がないので、たぶん、外してもそれほど違いはないと思います。
cartoon, 1990s cartoon
cartoon
は、「漫画」、1990s cartoon
は、「1990年代の漫画」の意味です。リアルな写真が目的なので、漫画の要素を打ち消しているのでしょう。
black show room
black show room
は、「黒い展示室」の意味です。通常呪文とほとんど関係がないので、たぶん、外してもそれほど違いはないと思います。
breaking bad scene
breaking bad scene
は、「ハメを外したシーン」の意味です。ハメを外したシーンを打ち消します。
animal
animal
は、「動物」の意味です。動物を打ち消します。
shaped bread
shaped bread
は、「成形されたパン」の意味です。通常呪文とほとんど関係がないので、たぶん、外してもそれほど違いはないと思います。
broken down grey wall
broken down grey wall
は、「壊れた灰色の壁」の意味です。たまに、背景が灰色になってしまうことがあるので、それを打ち消しているんだと思いますが、打ち消しきれていない気がします。
cheese and pepperoni
cheese and pepperoni
は、「チーズとパペロニ」の意味です。通常呪文とほとんど関係がないので、たぶん、外してもそれほど違いはないと思います。
black hair
black hair
は、「黒い髪」の意味です。金髪にするために、黒い髪を打ち消します。
duplicate
duplicate
は、「複製」の意味です。体のパーツが複製されるのを打ち消したいんじゃないかと思います。例えば、鼻が2つあるとか。
仲間募集
私たちは同じグループで共に働いていただける仲間を募集しています。
現在、以下のような職種を募集しています。
Stable Diffusionの全コンテンツ
- 人物写真編
- レンズ編
- 画像タイプ編
- 美少女アニメ画編
- 美少女写真編
- 女性イラスト編
- 美しい夜空を見渡す男編
- 魅惑的な女アニメ画(トゥーンレンダリング)編
- 美少女を高確率で出す呪文編
- 長い呪文は切り捨てられる編
- 蒸気機関が高度に発達したレトロなアニメ(スチームパンク)の世界観編
- A as Bの呪文による画像合成編
- かわいい動物の擬人化編
- バベルの塔のイラスト編
- TPU版の使い方
- 美少女アニメ画改善版
- v1.5 美少女画検証
- 東京タワーの写真
- 折り紙合体変形ロボ
- v2.0 美少女イラスト
- v2.1 AUTOMATIC1111
- v2.1 美少女アニメ画
- v2.1 金髪美女写真
- Waifu Diffusion 1.3.5_80000
執筆:@higa、レビュー:Ishizawa Kento (@kent) (Shodoで執筆されました)