画像生成に高速化の波が来ています。 通常の生成に比べ格段に処理が早いようです。これは試さなければ、、、 ※以前の記事でpinokioを使用してLCMのインストールは実施しましたが、UIが無いようなものだったのでちゃんと使えておらず。。。 Stable Diffusion webUIの拡張機能がリリースされているのでそちらを使って生成時間や画像を比較してみたいと思います。Nvidia Jetson AGX orin(32GBメモリ)を使用していきます。
目次
①今日のコンセプト
Stable Diffusion webUIで ・通常の生成とLCMの速度比較 ・生成された画像の内容を主観で比較 をやっていきます。
②準備
手順はこちらのページに記載されています。 とはいってもStable Duffusion webUIの拡張を入れるだけなので非常にあっさり終わります。
GitHub
![](data:image/gif;base64,R0lGODlhAQABAAAAACH5BAEKAAEALAAAAAABAAEAAAICTAEAOw==)
GitHub – 0xbitches/sd-webui-lcm: Latent Consistency Model for AUTOMATIC1111 Stable Diffusion WebUI
Latent Consistency Model for AUTOMATIC1111 Stable Diffusion WebUI – 0xbitches/sd-webui-lcm
まずはStable Diffusion webUIの画面を開き、Extensionタブを開きます。 さらにInstall from URLタブを開き以下のURL入力し、Installボタンを押します。
https://github.com/0xbitches/sd-webui-lcm
![](https://hosol.co.jp/wp-content/uploads/2023/11/install-1024x286.jpg)
参考記事のGitにはextensionsフォルダにcloneしてと書かれていますが、こちらの方がお手軽で動作も問題なかったのでこちらの方がいいかと思います。
少しするとインストールが完了するので終わったらReload UIで画面を更新します。タブの中にLCMがあればインストール完了です。
![](https://hosol.co.jp/wp-content/uploads/2023/11/install_complete-300x211.jpg)
LCMタブを開いた画面はこんな感じになっています。
![](https://hosol.co.jp/wp-content/uploads/2023/11/画面全体-300x292.png)
③LCMで画像生成
何はともあれ生成を行ってみます。設定は何もいじらず、シンプルなプロンプトでtxt2imgを実行します。
car
LCMの初回実行時にはモデル等のデータダウンロードが入ります。少し時間がかかるので待ちましょう。
スクロールできます
![](https://hosol.co.jp/wp-content/uploads/2023/11/image1.png)
![](https://hosol.co.jp/wp-content/uploads/2023/11/image2.png)
![](https://hosol.co.jp/wp-content/uploads/2023/11/image3.png)
![](https://hosol.co.jp/wp-content/uploads/2023/11/image-4.png)
特に変なところも見られない車の画像が4枚生成されました。最近の車というよりはちょっと旧車ですね。 生成にかかった時間は10秒でした。1枚あたり2.5秒と非常に高速でした。
画面上、img2imgやimg2videoのタブもあるのですがなぜかそちらはエラーが出てしまい動きませんでした。エラーの解消方法が分かり次第追記します。
④生成結果の比較
同じプロンプトで画像を生成する速度と内容を比較してみます。 極力条件は揃えたいので解像度は512 * 512、生成する数はLCMの初期が4枚になっていますので揃えます。参考でSDXLも生成時間を見てみたいと思います。 また、初期のモデルだと生成結果が悲惨なことになりそうなので少しいい感じのモデルをチョイスしています。あわせてみていきましょう。
プロンプト
Starry night milky sky, master piece, best quality , detailed , ((background only))
解像度
512 * 512
枚数
4枚
モデル名 | v1-5-pruned-emaonly.safetensors |
生成時間 | 2分40秒 |
スクロールできます
![](https://hosol.co.jp/wp-content/uploads/2023/11/image-6.png)
![](https://hosol.co.jp/wp-content/uploads/2023/11/image-1-1.png)
![](https://hosol.co.jp/wp-content/uploads/2023/11/image-2-1.png)
![](https://hosol.co.jp/wp-content/uploads/2023/11/image-3-1.png)
初期から入っているモデルです。出てきた画像はゴッホみたいな感じですね。
モデル名 | beautifulRealistic_v7.safetensors |
生成時間 | 2分40秒 |
スクロールできます
![](https://hosol.co.jp/wp-content/uploads/2023/11/image-1-2.png)
![](https://hosol.co.jp/wp-content/uploads/2023/11/image-2-2.png)
![](https://hosol.co.jp/wp-content/uploads/2023/11/image-3-2.png)
![](https://hosol.co.jp/wp-content/uploads/2023/11/image-4-1.png)
暗い森から星空を見上げている感じです。ちょっと画面は暗いですがこういうのが出てきたらなーと思っていたものに近い感じです。生成時間は初期モデルと変わりありません。
モデル名 | LCM |
生成時間 | 13秒 |
スクロールできます
![](https://hosol.co.jp/wp-content/uploads/2023/11/02_image.png)
![](https://hosol.co.jp/wp-content/uploads/2023/11/02_image-1.png)
![](https://hosol.co.jp/wp-content/uploads/2023/11/02_image-2.png)
![](https://hosol.co.jp/wp-content/uploads/2023/11/02_image-3.png)
わずか13秒で生成が完了しました。内容的にもかなりキレイですね。SDXLに慣れていることもあり、解像度が小さいことが気にはなりますが、クオリティに関してはSDXLに近いように感じます。
モデル名 | sd_xl_base_1.0.safetensors |
生成時間 | 3分17秒 |
スクロールできます
![](https://hosol.co.jp/wp-content/uploads/2023/11/image-7.png)
![](https://hosol.co.jp/wp-content/uploads/2023/11/image-2-3.png)
![](https://hosol.co.jp/wp-content/uploads/2023/11/image-1-3.png)
![](https://hosol.co.jp/wp-content/uploads/2023/11/image_.png)
SDXLでの生成です。解像度が1024 * 1024となっている割にはそこまで大きな差にはなっていないですが、やはり待っている感は出ます。生成される画像はやはりきれいなものが出てきますね。
⑤まとめ
生成時間を一覧にすると以下のようになります。
モデル名 | v1-5-pruned-emaonly | beautifulRealistic_v7 | LCM | sd_xl_base_1.0 |
---|---|---|---|---|
生成時間 | 2分40秒 | 2分40秒 | 13秒 | 3分17秒 |
LCMの生成時間は1/10以下になっており驚異的に早くなっています。 しかも生成される画像のクオリティは残念なものになると思っていたのですが、SDXL並に綺麗に出てきたので驚くばかりです。高解像度への対応が進めばプロンプトを入れたら即生成してくれる、その画像を資料作成に気軽に使えるようになって欲しいですね。
コメント