Stable diffusion 人気モデルのAnything系を徹底比較!秘密が明らかに!!

AI is in wonderland
16 May 202318:10

TLDRこのビデオでは、Stable DiffusionのAnything系列のモデルを徹底的に比較しました。V3、V4、V4.5、V5の4つのモデルが存在し、それぞれの特徴と違いについて解説されています。また、ブイヨンとV4.5は同じ作者によるとされていますが、V3の後継であるとされるV5は異なる作者によって作られています。さらに、イージーネガティブ、イージーネガティブV2、ディープネガティブの3つのネガティブエンベッティングも比較されています。プロンプトの比較方法として、公開されているプロンプトを分析し、傾向を可視化するプログラムの使用方法も紹介されています。最後に、比較の結果を示すために、エニシングシリーズのモデルとネガティブエンベッティングを用いた画像比較を行い、それぞれの特徴を詳細に解説しました。


  • 🎨 エニシングのバージョン(V3, V4, v4.5, V5)はそれぞれ異なる画風を持っています。
  • 🖼️ V3とV5は同じ作者で、青みが強い線がはっきりしています。
  • 🎭 V4.5は柔らかい感じで、輪郭線が細く色合いが淡く、夢見がちな印象を与えます。
  • 🧩 V3の後継モデルであるブイゴは、実際には別の作者によるとされています。
  • 🌟 V3系は輪郭が強く、漫画やアニメ風のイラストでよく見られる特徴があります。
  • 🌈 V4.5系は全体的に明るく、青みが強く、細かい背景の描写が特徴的です。
  • 📈 高解像度を使用すると、より細かい違いがわかります。
  • 🔍 ネガティブエンベッティングとしてイージーネガティブV2とディープネガティブが比較され、イージーネガティブの方が顔の光りや表情が豊かに表現されています。
  • 🖌️ イージーネガティブV2は背景の描写が細かく、全体的にビビッドな絵になる傾向があります。
  • 📊 XYZプロットを使用して、モデル同士の比較を行うことができます。
  • 🌐 WEBUIの背景をダークモードに変えることができます。

Q & A

  • anything系のモデルにはどのような種類がありますか?

    -anything系にはV3, V4, v4.5, V5の4種類があります。

  • ブイヨンとv4.5はどのような関係がありますか?


  • 拡張機能を使って、どのようにしてタグを見つけることができますか?


  • プロンプトを書くときに、提案される単語の数を増やすにはどうすればよいですか?


  • プロンプトの傾向を可視化する方法として、どのような方法がありますか?


  • XYZプロットを使用する際の注意点は何ですか?


  • イージーネガティブとディープネガティブの主な違いは何ですか?


  • V3とV5のモデル系列はどのような特徴を持っていますか?


  • V4.5のモデル系列はどのような特徴を持っていますか?


  • どのバージョンのモデルがあなたの好みですか?


  • 今後の動画でどのような内容が見たいですか?




🎼 Introduction and Extension Feature Discussion

The assistant, Alice, greets the audience and expresses her desire to explore the differences in art styles based on various versions of the 'anything' series. She mentions four types: V3, V4, v4.5, and V5, noting that V3's successor is rumored to be V4 but the truth is uncertain. Alice then discusses a browser extension that suggests 'ダンボールタグ' (cardboard tags) without needing to visit a specific site. She guides through the process of enabling the extension, adjusting settings for maximum results, and encountering an error that she resolves by restarting the UI. The assistant also talks about another method to study prompts by analyzing images to see which prompts were used.


📈 Analyzing Prompts with Google Colab and XYZ Plot

The assistant explains how to use Google Colab to analyze and visualize prompts. She instructs the audience to save a file with prompts, upload it to Google Colab, and run a provided program to visualize the frequency of each prompt. The assistant then transitions to the main topic of comparing the 'anything' series using an XYZ plot. She details the process of selecting models and negative prompts for comparison and emphasizes the ease of writing prompts with the installed extension. The assistant chooses specific settings for image generation, such as resolution, sampling method, and upscaling tool, and explains how to use the XYZ plot to compare models and negative prompts visually.


🖼️ Image Generation and Comparison of Models and Negative Prompts

The assistant generates images using different models and negative prompts, comparing the results. She observes that all models produce images with a distinct 'anything' series style but notes differences in facial expressions and painting techniques. The assistant finds that the 'Deep Negative' prompts result in more expressionless faces, while 'Easy Negative' prompts incorporate more details like facial shine and blush, giving a more anime-style appearance. She also compares 'Easy Negative V2' with the standard 'Easy Negative', noting differences in lighting and background detail. The assistant concludes that the V3 and V5 models share a similar series, as do V4 and v4.5, with V3/V5 having stronger outlines and colors, while V4/V4.5 have softer and more dreamy visuals.


🌟 Personal Preferences and Conclusion

The assistant shares her personal preference for the 'Easy Negative V2' used with the 'anything v4.5' model, appreciating the cuteness of the generated girl images. She acknowledges that while she could continue comparing different versions, the video has become lengthy. The assistant expresses her commitment to providing useful and enjoyable content, encourages viewers to subscribe and like the video, and invites comments on what kind of videos they would like to see next. She thanks the audience for watching to the end and concludes the video with a short movie of the image comparisons set to music.


Greeting and Introduction of Assistant
Interest in Exploring Different Versions of Anything Series
Different Versions: V3, V4, V4.5, V5
Authorship and Relationships Between Versions
Rumors and Uncertainties Regarding Succession and Authorship
Anything Series Overview
Automatic Eleven Extension for Danboard Tags
Usage of Extensions to Enhance User Experience
Installation and Configuration of Extensions
Troubleshooting and Restarting UI for Error Resolution
Technical Aspects and Extensions
Ease of Writing Prompts with Extensions
Increasing the Number of Suggested Words
Autocompletion of Tags and Convenience Features
Prompt Writing and Suggestions
Analyzing Publicly Available Prompts
Visualization of Prompt Trends Using a Custom Program
Involvement of Chat GPT for Programming Assistance
Research Methods for Prompts
Using XYZ Plot for Model Comparison
Selection of Checkpoints and Models for Comparison
Adjustments for Negative Embeddings
Seed Value Manipulation for Image Generation
XYZ Plot Comparison
Comparison of Easy Negative V2, Deep Negative
Differences in Facial Expressions and Background Details
Artistic Preferences and Version Selection
Negative Embeddings
Distinction Between V3/V5 and V4.5/Bygone Series
Characteristics of Each Series: Colors, Lines, and Details
Perception of Improvements in Newer Versions
Personal Preference for V4.5 with Easy Negative V2
Anything Series Model Comparison
Continuation of Exploring and Creating Content
Request for Channel Subscriptions and Likes
Invitation for Viewer Suggestions and Feedback
Conclusion and Future Work
Stable Diffusion Anything Series Comparison


💡Stable Diffusion

Stable Diffusionは、画像生成のアルゴリズムの一種で、テキストから画像を生成することができます。このビデオでは、Stable Diffusionの異なるバージョンがどのように異なる風格で画像を生成するかを比較しています。


Anything系はStable Diffusionのモデルの中で、特に多様な風格で画像を生成できるシリーズです。V3, V4, v4.5, V5の4つのバージョンが存在し、それぞれ異なる特徴を持っています。


ブイヨンは、Stable Diffusionのモデルの一つで、V3の後継モデルとされています。このビデオでは、ブイヨンを含むAnything系の他のモデルと比較して、絵風の違いを探求しています。














WEBUIとは、Web User Interfaceの略で、ウェブベースのユーザーインターフェースを意味します。ビデオでは、Stable Diffusionの操作をWEBUI上で行い、プロンプトの入力や設定変更を行う様子が説明されています。




比較対象はStable diffusionの人気モデルであるAnything系のV3, V4, v4.5, V5の4種類。













V3, V5系は個々のオブジェクトがはっきりと際立ち、背景は太い筆でラフに描かれています。


V3, V5系は奇形の発生頻度が高い印象がありましたが、新しいバージョンで改善していると感じました。

