Stable diffusion 人気モデルのAnything系を徹底比較!秘密が明らかに!!

AI is in wonderland
16 May 202318:10

TLDRこのビデオでは、Stable DiffusionのAnything系列のモデルを徹底的に比較しました。V3、V4、V4.5、V5の4つのモデルが存在し、それぞれの特徴と違いについて解説されています。また、ブイヨンとV4.5は同じ作者によるとされていますが、V3の後継であるとされるV5は異なる作者によって作られています。さらに、イージーネガティブ、イージーネガティブV2、ディープネガティブの3つのネガティブエンベッティングも比較されています。プロンプトの比較方法として、公開されているプロンプトを分析し、傾向を可視化するプログラムの使用方法も紹介されています。最後に、比較の結果を示すために、エニシングシリーズのモデルとネガティブエンベッティングを用いた画像比較を行い、それぞれの特徴を詳細に解説しました。

Takeaways

  • 🎨 エニシングのバージョン(V3, V4, v4.5, V5)はそれぞれ異なる画風を持っています。
  • 🖼️ V3とV5は同じ作者で、青みが強い線がはっきりしています。
  • 🎭 V4.5は柔らかい感じで、輪郭線が細く色合いが淡く、夢見がちな印象を与えます。
  • 🧩 V3の後継モデルであるブイゴは、実際には別の作者によるとされています。
  • 🌟 V3系は輪郭が強く、漫画やアニメ風のイラストでよく見られる特徴があります。
  • 🌈 V4.5系は全体的に明るく、青みが強く、細かい背景の描写が特徴的です。
  • 📈 高解像度を使用すると、より細かい違いがわかります。
  • 🔍 ネガティブエンベッティングとしてイージーネガティブV2とディープネガティブが比較され、イージーネガティブの方が顔の光りや表情が豊かに表現されています。
  • 🖌️ イージーネガティブV2は背景の描写が細かく、全体的にビビッドな絵になる傾向があります。
  • 📊 XYZプロットを使用して、モデル同士の比較を行うことができます。
  • 🌐 WEBUIの背景をダークモードに変えることができます。

Q & A

  • anything系のモデルにはどのような種類がありますか?

    -anything系にはV3, V4, v4.5, V5の4種類があります。

  • ブイヨンとv4.5はどのような関係がありますか?

    -ブイヨンとv4.5は同じ作者によって作られたものですが、V3とV4系列との関係は明確ではありません。

  • 拡張機能を使って、どのようにしてタグを見つけることができますか?

    -拡張機能を使って、オートマティックイレブンイレブンを起動し、エクステンションのボックスを開いてアウェイラブルをチェックすることでタグを見つけることができます。

  • プロンプトを書くときに、提案される単語の数を増やすにはどうすればよいですか?

    -プロンプトを書くときに提案される単語の数を増やすためには、セッティングボックスに入り、タグオートコンプリートを選択して、マキシマムレザルトの数値を増やします。

  • プロンプトの傾向を可視化する方法として、どのような方法がありますか?

    -プロンプトの傾向を可視化する方法として、チャットGPTフォーさんによって提供されたプログラムを使用して、公開されているプロンプトから傾向を簡単に可視化することができます。

  • XYZプロットを使用する際の注意点は何ですか?

    -XYZプロットを使用する際には、モデルごとに改行されていないため、慎重に選択する必要があります。また、一度ジェネレートを押せば、選んだモデルを順番に使いながら画像を生成します。

  • イージーネガティブとディープネガティブの主な違いは何ですか?

    -イージーネガティブとディープネガティブの主な違いは、顔の塗り方です。ディープネガティブはベタ塗りで顔の光をあまり表現しないのに対して、イージーネガティブ系は顔の光り、頬の赤み、表情などを絵に取り入れています。

  • V3とV5のモデル系列はどのような特徴を持っていますか?

    -V3とV5のモデル系列は青みが強く、線がはっきりしています。また、V3のみ走っている時のキラキラの汗を描写し、個々のオブジェクトやキャラクターがはっきりと際立ちます。

  • V4.5のモデル系列はどのような特徴を持っていますか?

    -V4.5のモデル系列は輪郭が細く、色合いが淡く、より柔らかい、夢見がちな印象を与えるような絵を作り出します。視覚的な流れが生まれ、イラスト全体が統一感のある印象を与えます。

  • どのバージョンのモデルがあなたの好みですか?

    -私の好みはイージーネガティブV2を使用したエニシングv4.5です。

  • 今後の動画でどのような内容が見たいですか?

    -今後の動画で見たい動画の内容があればコメント欄に投稿していただけますと助かります。

Outlines

00:00

🎼 Introduction and Extension Feature Discussion

The assistant, Alice, greets the audience and expresses her desire to explore the differences in art styles based on various versions of the 'anything' series. She mentions four types: V3, V4, v4.5, and V5, noting that V3's successor is rumored to be V4 but the truth is uncertain. Alice then discusses a browser extension that suggests 'ダンボールタグ' (cardboard tags) without needing to visit a specific site. She guides through the process of enabling the extension, adjusting settings for maximum results, and encountering an error that she resolves by restarting the UI. The assistant also talks about another method to study prompts by analyzing images to see which prompts were used.

05:02

📈 Analyzing Prompts with Google Colab and XYZ Plot

The assistant explains how to use Google Colab to analyze and visualize prompts. She instructs the audience to save a file with prompts, upload it to Google Colab, and run a provided program to visualize the frequency of each prompt. The assistant then transitions to the main topic of comparing the 'anything' series using an XYZ plot. She details the process of selecting models and negative prompts for comparison and emphasizes the ease of writing prompts with the installed extension. The assistant chooses specific settings for image generation, such as resolution, sampling method, and upscaling tool, and explains how to use the XYZ plot to compare models and negative prompts visually.

10:06

🖼️ Image Generation and Comparison of Models and Negative Prompts

The assistant generates images using different models and negative prompts, comparing the results. She observes that all models produce images with a distinct 'anything' series style but notes differences in facial expressions and painting techniques. The assistant finds that the 'Deep Negative' prompts result in more expressionless faces, while 'Easy Negative' prompts incorporate more details like facial shine and blush, giving a more anime-style appearance. She also compares 'Easy Negative V2' with the standard 'Easy Negative', noting differences in lighting and background detail. The assistant concludes that the V3 and V5 models share a similar series, as do V4 and v4.5, with V3/V5 having stronger outlines and colors, while V4/V4.5 have softer and more dreamy visuals.

15:07

🌟 Personal Preferences and Conclusion

The assistant shares her personal preference for the 'Easy Negative V2' used with the 'anything v4.5' model, appreciating the cuteness of the generated girl images. She acknowledges that while she could continue comparing different versions, the video has become lengthy. The assistant expresses her commitment to providing useful and enjoyable content, encourages viewers to subscribe and like the video, and invites comments on what kind of videos they would like to see next. She thanks the audience for watching to the end and concludes the video with a short movie of the image comparisons set to music.

Mindmap

Keywords

💡Stable Diffusion

Stable Diffusionは、画像生成のアルゴリズムの一種で、テキストから画像を生成することができます。このビデオでは、Stable Diffusionの異なるバージョンがどのように異なる風格で画像を生成するかを比較しています。

💡Anything系

Anything系はStable Diffusionのモデルの中で、特に多様な風格で画像を生成できるシリーズです。V3, V4, v4.5, V5の4つのバージョンが存在し、それぞれ異なる特徴を持っています。

💡ブイヨン

ブイヨンは、Stable Diffusionのモデルの一つで、V3の後継モデルとされています。このビデオでは、ブイヨンを含むAnything系の他のモデルと比較して、絵風の違いを探求しています。

💡ネガティブエンベッディング

ネガティブエンベッディングは、画像生成の際に特定の要素を避ける指示です。ビデオではイージーネガティブ、イージーネガティブV2、ディープネガティブの3つのタイプを比較し、絵風の違いを分析しています。

💡XYZプロット

XYZプロットは、比較分析を行うための手法で、異なるモデルや設定での画像生成を並べて比較することができます。ビデオでは、これを使ってAnything系のモデル間の相違を視覚的に比較しています。

💡プロンプト

プロンプトとは、画像生成アルゴリズムに入力するテキストのことです。プロンプトの内容によって生成される画像の風格や内容が大きく変わります。ビデオでは、プロンプトを用いて、異なるモデルでの画像生成結果を比較しています。

💡ハイレゾ

ハイレゾとは、高解像度を意味します。ビデオでは、画像のアップスケールにハイレゾというツールを使用し、生成された画像の品質を向上させています。

💡VRAM

VRAMは、ビデオランダムアクセスメモリの略で、画像のアップスケールなどを行う際に使用されるグラフィックカードのメモリです。ビデオでは、VRAMの容量がアップスケールの倍率に影響すると触れています。

💡タグオートコンプリート

タグオートコンプリートは、入力されたテキストに基づいて、関連するタグを自動的に提案する機能です。ビデオでは、この機能を使ってプロンプトをより効率的に生成することができると紹介しています。

💡WEBUI

WEBUIとは、Web User Interfaceの略で、ウェブベースのユーザーインターフェースを意味します。ビデオでは、Stable Diffusionの操作をWEBUI上で行い、プロンプトの入力や設定変更を行う様子が説明されています。

💡チャットGPT

チャットGPTとは、自然言語処理アルゴリズムの一つで、テキストベースの対話を行うことができます。ビデオでは、チャットGPTを使用してプロンプトの傾向を可視化するプログラムを構築しています。

Highlights

比較対象はStable diffusionの人気モデルであるAnything系のV3, V4, v4.5, V5の4種類。

ブイヨンとv4.5は同じ作者によるものだが、V3とV5は異なる作者によるとされています。

V3の後継モデルはブイゴと噂されていますが、本当のところは不明。

拡張機能を使って、ウェブサイトでタグを検索する方法が紹介されました。

オートコンプリート機能を使って、プロンプトをよりスムーズに入力することができる。

プロンプトの傾向を可視化するプログラムが提供され、使用方法が説明されています。

Googleコラボを使用して、プロンプトの分析を行う方法が紹介されました。

XYZプロットを使って、異なるモデルの絵画スタイルを比較することができました。

イージーネガティブV2とディープネガティブの絵画スタイルの違いが明らかになりました。

イージーネガティブ系は顔の光りや表情を絵に取り入れている傾向があります。

V3とV5は青みが強く、線がはっきりしている印象があります。

V4.5は輪郭線が柔らかく、全体的にやわらかい印象を与えるような絵を生成します。

V5は背景にぼやけた雰囲気を作り、V4.5は細部を描こうとしている傾向があります。

V3, V5系は個々のオブジェクトがはっきりと際立ち、背景は太い筆でラフに描かれています。

V4.5の絵は視覚的な流れが生まれ、統一感のある印象を与えると述べています。

V3, V5系は奇形の発生頻度が高い印象がありましたが、新しいバージョンで改善していると感じました。

個人的な好みとして、イージーネガティブV2を使用したエニシングv4.5がおすすめされました。

今後も役立つ、楽しい動画の配信を続けることがアナウンスされました。