生成AIグラビアをグラビアカメラマンが作るとどうなる?第23回:STABLE DIFFUSION AUTOMATIC1111 V1.9の新機能と使い方を解説(西川和久)

他の写真を見る

グラビアカメラマンでエンジニアの西川和久氏による生成AIグラビア連載、今回は画像生成モデルStable Diffusion を使う定番インターフェースのひとつ Automatic1111の新バージョン解説と、プロンプトから高速に画像を検索できるエクステンションSearchMyPNGの使い方について。

自分の声のまま多言語な声に変換できる商用利用可能な音声クローンAI「OpenVoice V2」、AppleとMicrosoftがスマホ上でも動く生成AIを発表など重要論文5本を解説(生成AIウィークリー)

生成AIグラビアをグラビアカメラマンが作るとどうなる?連載記事一覧はこちら

4月13日にv1.9.0リリース!現在v1.9.3へ

AUTOMATIC 1111は、v 1.8.0を軽く確認した以降、AUTOMATIC1111 Forgeばかり使っていて、ご無沙汰だったのだが、4月13日、Xのタイムラインにv1.9.0の文字が流れてきた。これは!とアップデートの内容を確認すると、主な部分は以下の通り。

ご覧の様に意外と少ない(もちろんパフォーマンス向上や細かい修正なども含まれる)。ただ1の「メインUIにSchedulerの項目を追加」は非常に大きい改良だ。

以前この連載でも指摘していたが、AUTOMATIC1111のSampling methodは、SamplerSchedulerを一つにまとめており、例えば

DPM++ 2M SDE Karras

という表記に。ところがComfyUIなど他のアプリだと

DPM++ 2M SDE / Karras

と、二つに分けて表示しているのだ。Stable Diffusion的には後者が正解

1の表記方法で困るのは、例えば、Euler。これは本来、Sampler eulerで、Schedulerは何か設定されているはずなのだが、これだと何か分からない。

加えて去年(2023年)後半以降、SchedulerにLCMやTurboなど、いろいろなものが出てきてしまい、従来の方法で全部に対応しようとすると、1つのSamplerに対してSchedulerの種類分、一覧の中が増えることになる。

実際ずらっと並んだ一覧を見ると、何が何だか…と分からなかった人も多かったのではないだろうか。

おそらくAUTOMATIC1111が前者のようになっていたのは、初期の頃、SamplerとSchedulerの種類が少なく、であればまとめて一つの項目にした方がいいよね!的な発想だったのだろう。

これを本来のSamplerとSchedulerに項目を分けることでスッキリさせたのがv1.9系の大きな変更部分となる。

Schedulerに関してはもう一つ、2のsgm_uniformが追加された(ForgeにはDPM++ 2M SDE SGMUniformがある)。これはSDXL-Lightningモデル用だ。

そして3は、Extensionsなどを読み込む時、順番の並び替えに対応した。Settings[Show all pages]、 Webブラウザのページ内検索にcallbackと入れれば、該当部分が見つかる。

通常、触る必要が無いと思うが、例えばExtensions同士の食い合わせで、うまく動かなくなった時に、このロードする順番を並び替えてうまく行くケースがあるかも知れない。

パフォーマンスに関しては、詳しく比較したわけでは無いものの、Forgeの方が生成速度、リソースの消費量共にまだ優れている様だ。

AUTOMATIC1111 vs Forge。上記の優位性はもちろんだが、個人的にはModelの切り替え時、かかる時間がかなり違うのが、使っている理由として大きい。

と言うのも、同じPrompt/設定でModelを切り替えての結果比較や、xyzプロットでModel比較などを行うと時間が大幅に変わる。関係ない人には関係ないものの、筆者的には結構重要だったりする。

ところで、v1.9.0のSamplerとSchedulerを分けた部分、Forgeでも直ぐ追従すると思ったが、2週間経ってもいっこうに動きがない。Fooocusもかなりの時間放置。作者のlllyasviel氏、Xでも最近書き込みが無く、忙しいのか何かあったのか…。

話が逸れてしまったが、以降、ちょっとした機能追加やBUG修正が行われ、執筆時点で v1.9.3になっている。

v1.8.0からのUpdateは、git cloneでインストールしたケースだと、git pullで自動的に更新され、特に難しいことはない。もちろん環境もそのまま引き継がれる。

Promptのキーワードで生成した画像をサクッと検索できる便利なSearchMyPNG

筆者は普段、AUTOMATIC1111で生成した画像を参照するときは”Infinite image browsing”を使っている。表示速度が速く、Promptの確認、Promptをtxt2imgへ転送などができたり非常に便利だ。

Prompt内容による検索機能もあるが、(重量級で)設定項目がそれなりにあり、サクッと探したいときには少し面倒だったりする。

こんな場合は検索に特化した”SearchMyPNG”が便利。初回[Create Database]ボタン、更新時は[Update Database]ボタンを押す必要があるものの、あとはSearch wordに探したい画像のキーワードを入れ[Search]ボタンでOK。

txt2imgへPromptを送る機能は無いが、画像を一旦ダウンロードして、PNG Infoで情報を送ればいいので、(一手間かかるが)特に問題ではない。

インストール方法はExtensions > Install from URLでGitHubのURLを入れ、[Install]。AUTOMATIC1111を再起動すれば上のタブにSearchMyPNGが増えている。関連するModelやファイルなどをインストールする必要もなく確実に作動する。生成した画像が溜まってきたら使いたいツールの一つだ。

今回締めのグラビア

最近筆者が好んで使っているSampler設定は、DPM++ 2M SDE, SGM Uniform, Steps 25, CFG scale 4.5

FooocusやComfyUIでも同様。もちろんModelによって微調整でStepsやCFG scaleは変わる事もある。

一般的にSchedulerはKarrasだと思うが、少し癖があるのとコントラストが高め(の様な気がする)。と言うことで、せっかくAUTOMATIC1111 v1.9系にSGM Uniformが追加されたので、それを使って作ったのが以下のグラビアだ。

本来SDXL-Lightningモデル用だが、普通のModelでもいい感じに出るため構わず使っている(笑)。

もう一つのお気に入りは、Euler, Karras。ただこのパターンはStepsとCFG scaleが大きめで50, 7となる。SamplerにDPM++ 2M SDEを使うとくどい感じになりがちなので、あっさりした絵にしたい時はこの設定がお勧め。扉の写真はこちらのパターン。GWなので旅行中の駅っぽくしてみた。

AUTOMATIC1111 v1.9系はSamplerとSchedulerの組み合わせが出来るようになったので(ダメなのもあるが)、いろいろ試してほしい。

編集部より:テクノエッジでは西川氏を講師に迎え、ライブで画像生成を試しつつ直接質問もできる『グラビアカメラマンが教える、生成AIグラビア実践ワークショップ』をオンラインで定期的に開催しています。

クラウドサービスを使うため、高性能なPCやGPUは不要。受講料にはクラウドサービスの利用料も含みます。

テクノエッジの会員制コミュニティ『テクノエッジ アルファ』加入者のかたは、生成AIグラビアワークショップを含めオンラインイベントに無料で参加でき、アーカイブも視聴いただけます。

1km先まで飛んで要救助者を救うドローン浮き輪「TY-3R」。中国企業が開発

作曲歌唱AI「Suno」、今からでも間に合う制作マニュアル。やり方がちょっと変わったので(CloseBox)

生成AI音楽のYouTubeライブ配信「AIライブハウス」を毎週水曜お昼オープン。5月1日の第1回はリアルタイムで別の声を纏うVocoflex実演(CloseBox)

2024-05-01T05:54:34Z dg43tfdfdgfd