AIにより生成された女性の画像イメージ
CHECK POINT: DUCHAITEN-PONY-XL (NO-SCORE) PONY-NO-SCORE_V4.0
LORA: AESTHETIC ANIME LORA V1S
LORA: MIDJOURNEY MIMICV1.2

最初は Web UI

画像生成AIをさわり始めて5ヶ月くらいになりました。
そんな頻繁に取り組んでたわけではないですが、つい先日までは Stable Diffusion Web UI(AUTOMATIC1111版)で画像生成してました。

手動で環境をセットアップして、Civitai から Checkpoint や LoRA をダウンロードしてローカルに設置。
拙い知識で、プロンプトらしきもの…を綴り、猫などの動物や、人らしき何か…が生成されるのを楽しんでいました。

ある日、Web UI の更新を行った際に何やってもエラーが出るようになってしまいました。インターネットにもよく記事が上がってたやつです。

諦めが早いのが私のいいところです。
旧環境を全て削除して「Stability Matrix」インストール。
え、めっちゃ便利やん。。。
そこからは Stability Matrix で Web UIを使うようになりました。

当時参考にした記事

https://ascii.jp/elem/000/004/188/4188510

今は ComfyUI が楽しいし便利

Web UIにも少し慣れてきて、いつか ComfyUI でワークフロー使ってみたいなーと思ってた時、Stability Matrix に ComfyUI のインストール項目があるのに気づいてしまう。
迷うことなくインストール。
設定の手間とか面倒に感じて躊躇してたけど、クリックひとつで ComfyUI 使えるようになって感動。

使ってみて思ったのは、生成処理が早い。
単発生成で精度を求められないので、現状は結構な数を生成してSSRやSRを手元に残す感じです。
Web UI に比べ処理が早いのでこのへんの恩恵は大きく感じています。
それから Web UI を少しでもさわってたからと思うけど、割と直感的に理解しやすかった。

プロンプトは単語より文章(諸説あり)

私は英語が得意ではありません。
なので、画像生成AIをはじめた頃はとにかく単語と「 , 」や「 ( ) 」を乱用していました。
それでも何かしら生成されるのであまり気にしてはいませんでした。

少し慣れてきた頃、生成結果を、より自分がイメージした通りに…と思うようになってしまいました。
そうなるとネガティブプロンプトによって生成が破綻するケースが増えました。

さながら、デザインも出来ないのに、上から目線でデザイナーに指示をする嫌な上司のような感じですね。

制御系の拡張機能などあるのは知っていたのですが、それらの使用は、私の求める画像生成AIの楽しさから少し離れてしまう感じがして利用していません。(今はです)

どうにもうまくプロンプトを考えられない時に、インターネットでChatGPTにプロンプト成形させてるって記事を見つけたので試してみました。

試しに、「海」「女性」と入力しプロンプト生成の指示をすると、以下のようにもっと詳しくとつつかれます。(わかりやすい極端な例)

  • 女性の年齢や外見(髪型や色、目の色など)はどのようなものですか?
  • 女性の服装やアクセサリーはどのようなものですか?
  • 女性のポーズや表情はどのようなものを希望しますか?
  • 背景の詳細や特に強調したい要素(波、夕日、船など)はありますか?
  • イラスト全体の雰囲気(ファンタジー、現実的、ロマンチックなど)はどのようなものですか?

ChatGPT先生からのこの回答で、単語でのプロンプトの限界を理解しました。
上記を意識した、このページにあるAI生成画像のプロンプトは次のようなものです。

傑作、最高品質、高解像度、複雑、8K、リアルな写真: 1.4、ファインピクセル、(完璧な照明: 1.4)、晴れた熱帯のサンゴ礁のシーン。 16歳の人魚の女の子。彼女は、笑顔と深く自然な色の瞳を持つ、キュートで完璧な顔を持っています。彼女は引き締まった完璧なボディと非常に日焼けした肌を持っています。彼女の髪は明るい茶色で、泡立っています。水は魔法のような青い色です。
Masterpiece, Top Quality, High Resolution, Complex, 8K, Realistic Photo: 1.4, Fine Pixel, (Perfect Lighting: 1.4), Sunny Tropical Coral Reef Scene. A 16 year old mermaid girl. She has a cute and perfect face with a smile and deep, natural colored eyes. She has a toned perfect body and very tanned skin. Her hair is light brown and bubbly. The water is a magical blue color.

私は最初に「品質」「解像度」「照明」について入れるようにしています。
あとは状況説明の作文のような感じですね。
このプロンプトには動作を指定するような要素が入っていないため、12(batch_size)枚生成中、胸部から顔にかけてのカットがほとんどでした。

上記のプロンプトに少し変更を加え、「人魚」のワードを外し、「水着」「フリーダイビング」という要素を入れてみましょう。

傑作、最高品質、高解像度、複雑な、8K、リアルな写真:1.4、細かいピクセル、(完璧な照明:1.4)、晴れた熱帯のサンゴ礁のシーン。 16歳の少女がフリーダイビングをしている。彼女は、笑顔と深く自然な色の目をしたキュートで完璧な顔をしています。彼女は引き締まった完璧なボディと非常に日焼けした肌を持っています。彼女の髪は明るい茶色で、泡を吐いています。彼女は水着を着ています。水は魔法のような青い色です。
masterpiece, best quality, highres, intricate, 8K, realistic photo:1.4, fine pixel, (perfect lighting:1.4), A sunny tropical coral reef scene. A 16-year-old girl is free diving. She has a cute, perfect face with a smile and deep, naturally colored eyes. She has a toned, perfect body and very tanned skin. Her hair is light brown, and she is exhaling bubbles. She is wearing a swimsuit. The water is a magical blue color.

結果は、躍動感あふれる12(batch_size)枚が出力されました。

ちなみに、ネガティブプロンプトは必要最低限にするようになりました。
最初の書き出しは、ネガティブプロンプトなしで検証します。
その結果を見て、必要なものを加えていく感じです。

NSFW, ((text:2)), ((bad anatomy:2)), ((long torso:2)), makeup:2, bad eyes:2, blusher:2, belly button:1, (worst quality:2), (low quality:2), (normal quality:2), out of focus, JPEG artifacts, low resolution, error,
  • 投稿するコミュニティの閲覧レベルに配慮するもの
    NSFW:アダルト要素の排除
  • 出力の品質を下げないようにするもの
  • 文字の入り込みを抑えるもの
  • 人体などの変形や崩れを抑えるもの

利用する CHECK POINT のダウンロードページにも、良い出力結果を得られるための設定情報が明記されているものもあります。
推奨 LoRA についても同じく紹介されていたりします。

手探りで気に入ったものを組み合わせるのも楽しいですが、まずはモデル提供元の推奨設定で生成すると良い結果が出やすいです。

今のところ

品質の良い生成結果は求めるところですが、それと同時に、何よりも「感動」を欲しています。
AIによって期待以上の何かを感じられること。
今はその衝動で、趣味として画像生成AIを楽しんでいます。