始めに
まずは慣れるためにテーマを決めて画像生成を試していきたいと思います。 今日は画像生成AIを使っていきます。 今話題のstable diffusionを使って、画像生成AIでどんなものができるのか、試していきます。使い方と、どんな結果が出てくるのか、試行錯誤しながら試していきます。 プロンプトによって変わる結果などについて触ってみながら学んでいきます。
Stable Diffusion とは
詳細は他の方がかなり詳しく紹介して頂いているのでここではサラッとご紹介です。
Stable DiffusionはStability AIがオープンソースAIとして公開している画像生成AIです。 画像生成AIとしては他にも「Midjourney」などが話題となりましたが、Stable diffusionは無料で公開されているため、枚数の制限なく生成が可能となります。
Web上で生成を試すことが可能なサービスも展開されているのですが、グラフィックボードを使用することからか解像度や枚数に制限が設けられていることがあります。 ローカルで動かすことができる、Stable Diffusion web UI (AUTOMATIC1111版)というフォークを使用することでGUIを使いながら枚数の制限なく様々な画像を生成することができますので、使い勝手を覚えていこうと思います。
画像生成スタート
今日のコンセプト
上記のフリー素材の写真と同じようなものを生成するトレーニングをしてみます。 とりあえずプロンプトとモデルをいじりながら生成の方向性を探っていきたいと思います。
①1枚目
- ◆プロンプト
-
forest, morning, dazzling, nature, green, brilliance, wood, photo like, wide field of vision, bright sunshine
- ◆ネガティブプロンプト
-
human, worst quality
- ◆checkpoint
-
mdjrny-v4
感想
それっぽいイラストにはなっていますが、写真っぽくしたかったのにこのモデルはどうも違うみたいでした。
②2枚目
- ◆プロンプト
-
forest, morning, dazzling, nature, green, brilliance, wood, photo like, wide field of vision, bright sunshine
- ◆ネガティブプロンプト
-
human, worst quality
- ◆checkpoint
-
realisticVisionV20_v20_2
感想
なんかいい感じになってきました。しかし、写真のような感じはあまり出ていません。
③3枚目
- ◆プロンプト
-
forest, morning, dazzling, nature, green, brilliance, wood, photo like, wide field of vision, bright sunshine, portrait photography, wheel track
- ◆ネガティブプロンプト
-
human, worst quality
- ◆checkpoint
-
realisticVisionV20_v20_2
感想
参考の画像にある車の轍を再現するため、「wheel track」のプロンプトを追加しました。 するとなぜか列車のレールと人?が出てきました。ネガティブプロンプトで禁止したはずですが・・・
④4枚目
- ◆プロンプト
-
forest, morning, dazzling, nature, green, brilliance, wood, photo like, wide field of vision, bright sunshine, portrait photography, wheel track
- ◆ネガティブプロンプト
-
human, worst quality, rail
- ◆checkpoint
-
realisticVisionV20_v20_2
感想
突然現れたレールを消すべくネガティブプロンプトに「rail」を追加しました。 レールは消えたのですが、どこからか謎のバイクに乗った女性が現れました。。。
⑤5枚目
- ◆プロンプト
-
forest, morning, dazzling, nature, green, brilliance, wood, photo like, wide field of vision, bright sunshine, portrait photography, wheel track
- ◆ネガティブプロンプト
-
human, worst quality, rail, woman, bike
- ◆checkpoint
-
realisticVisionV20_v20_2
感想
バイクの女性を消すために「woman, bike」をネガティブプロンプトに追加しました。 見事、バイクに乗った女性はいなくなりました。ただ、雰囲気的には②の方がきれいですね。。。
⑥6枚目
- ◆プロンプト
-
forest, nature, green, bright sunshine, wood, photo like, wide field of vision, bright sunshine, portrait photography, wheel track
- ◆ネガティブプロンプト
-
human, worst quality, rail, woman, bike
- ◆checkpoint
-
realisticVisionV20_v20_2
感想
あえてプロンプトを少し減らすことにしました。 雰囲気が出るかなと思って追加していた「morning, dazzling, brilliance」を「bright sunshine」にまとめました。 すると、わりと求めていた雰囲気に近いのではないかというものが出来上がりました。
まとめ
わりと雰囲気は寄せられたように思いますが、求めていたほど写真に近いものはできませんでした。得意な部分をよく研究してみないとですね。 次回以降ももっといろいろと試してみたいと思います。
おまけ
生成された画像は解像度は512×512と少し小さめです。 利用しやすいサイズまで大きくできないかやってみます。 ※こちらの記事を参考にさせていただきました。 Seedというものを使うと同じ画像を使い回せるらしい、、、 Seed:2146033036 上記のSeed値で、画像の幅・高さを変えてみます。 幅:1920 高さ:1080
はい、また人が出てきました。 縦横比が変わったためか道も2つになっています。 とりあえず縦横比を1:1にしてやり直します。 幅:1024 高さ:1024
縦横比は変えてないのになぜか人は出てきてしまいます。。。 ネガティブプロンプトの効果がどの程度なのか、探ってみる必要がありそうです。 また次回以降、ここら辺を掘り下げていければと思います。 とりあえず今日のところはここまで
コメント