SDXLでも使える?【ADetailer】顔の崩れや指の変形をきれいに自動修正。インストールと使い方解説。画像生成AIイラストをStableDiffusion WebUIで AUTOMATIC1111

なぎのブログとYoutubeマナブちゃんねる
15 Oct 202313:47

TLDR今日の動画では、AI生成されたイラストの顔や手などの細部を自動で修正できる拡張機能「テーラー」の使い方と特徴について解説しました。テーラーは顔や手の変形を検出し、自動で修正することが可能です。また、顔の表情を変えることも可能です。この機能は、画像生成AI「Stable Diffusion」のWebUIで使用でき、手順はシンプルで、エクステンションズタブからURLを通じてインストールすることができます。テーラーを使用することで、より自然なAIイラストを生成することが可能になりますが、高スペックのグラフィックカードが必要です。また、VRAMが12GBでギリギリの状態になると、生成された画像の変化が少なくなります。今後、テーラーを他の拡張機能と組み合わせて使用する方法などの詳細を紹介する動画も公開予定です。

Takeaways

  • 🎨 AIイラストの顔や手などの細部を自動で修正することができる拡張機能「テーラー」について解説されています。
  • 🔍 テーラーは顔や手の崩れを自動で見つけ、修正することが可能です。また、顔の表情を変えることも可能です。
  • 🖼️ テーラーは画像を生成する際に、自動で修正箇所を検出して形を改善して修正を加えます。
  • 📈 テーラーを使用すると、指の詳細を綺麗に書き直すことは難しいですが、かなりの改善が見込めます。
  • 💻 ステーブルディフュージョンWEBUIの環境構築が前提とされています。また、スペックが足りない場合にも、スマホからアクセスできるサービスが開発中です。
  • 📱 テーラーのインストール方法は2つあり、URLからダウンロードする方法が紹介されています。
  • 🔗 インストール後、テーラーが正しく動作しているかどうかを確認する方法が説明されています。
  • 🛠️ テーラーを使用する際には、テキストtoイメージで有効にし、ディテイラーモデルを選択する必要があります。
  • 📝 プロンプトを併用することで、テーラーによる補正の精度を上げることができます。
  • 📉 テーラーの設定では、一度に修正する場所の数や、修正前の画像の保存などができる設定項目があります。
  • 💡 SDXLでもテーラーを使用することが可能ですが、グラボが12GBでギリギリの状態になるとのことです。
  • 🌐 テーラーの詳細な使い方や、他の拡張機能と組み合わせる方法については、近日中に公開される動画で解説される予定です。

Q & A

  • テーラーとはどのような機能を提供していますか?

    -テーラーはAIイラストの顔や手などの崩れを自動で見つけて修正することが可能な拡張機能です。また、顔の表情を変えることも可能です。

  • テーラーのインストール方法にはどのような種類がありますか?

    -テーラーのインストール方法は2つあります。1つはST diffWeUIのエンシタブからインストールする方法で、もう1つはfromURLを使ってGitHubからダウンロードする方法です。

  • テーラーを使用する際には、どのモデルを選ぶべきですか?

    -テーラーで修正したい場所に合わせて、顔や手などのディテイラーモデルを選ぶことができます。特に、YV8N系統のモデルが推奨されています。

  • プロンプトを併用することでどういった効果が得られますか?

    -プロンプトを併用することで、テーラーによる補正の精度を上げることができます。修正したい場所の詳細をプロンプトとして入力することで、より正確な修正が可能です。

  • テーラーの設定で、MAXモデルズとは何を設定する項目ですか?

    -MAXモデルズは、適用するモデルを最大いくつまでするかを設定する項目です。一度に同時に修正をかける場合、顔と手とキャラクターの3種類のモデルまでが一般的です。

  • テーラーの設定で、セーブマスクプレビューズとは何ですか?

    -セーブマスクプレビューズは、チェックを入れると検出と補正する範囲を可視化した画像が保存される設定です。補正するエリアと補正する量を視覚的に確認できるため、設定を理解しやすくなります。

  • テーラーを使用する際には、どのバージョンのStable Diffusion WebUIが推奨されますか?

    -テーラーを使用する際には、Stable Diffusion WebUIのautomattic1111のバージョン1.6が推奨されます。ただし、グラボが12GBでギリギリ使える状態になるとのことです。

  • テーラーが動作するのに必要なグラフィックカードのスペックは何ですか?

    -テーラーが動作するのに必要なグラフィックカードのスペックは、VRAMが12GB推奨です。これは、最近のゲームの要求スペックを超えるレベルのスペックが必要です。

  • テーラーの動作が遅い場合、どのように対処すればよいですか?

    -テーラーの動作が遅い場合、時間をかけて処理させることができます。VRAM不足でも、時間をかけることで補正が適用されることが示されています。

  • テーラーの動作がスムーズでない場合、どのような解決策がありますか?

    -スムーズでない場合、スペックの足りない場合や生成速度を上げたい人は、グラボがないパソコンやスマホでもStable Diffusion WebUIを使うことができるウェブサービスを使用することができます。

  • テーラーの拡張機能を他の拡張機能と組み合わせて使うことができますか?

    -はい、テーラーの拡張機能は他の拡張機能と組み合わせて使うことができます。設定で「アプライオンリーセレクテッドscpt2WAY」にチェックを入れることで、他の拡張機能の効果を有効にすることができます。

  • テーラーを使用する際には、どのような注意点がありますか?

    -テーラーを使用する際には、パソコンのスペックが十分でない場合や、環境構築が難しい場合は注意が必要です。また、設定を変更する際には、自分に合った設定に調整することが重要です。

Outlines

00:00

🖼️ Introduction to Tailor: An AI Illustration Correction Extension

The video script introduces an extension named Tailor, which is capable of automatically detecting and correcting imperfections in AI-generated illustrations, specifically faces and hands. It mentions the ability to change facial expressions and likens the process to image inpainting. The Tailor extension is highlighted as a tool that not only detects areas needing correction but also improves the form and appearance without requiring specific instructions from the user. The script also discusses the use of prompts to enhance the precision of corrections and mentions a stable diffusion web UI environment as a prerequisite. It provides a brief guide on how to install Tailor from a GitHub URL and assures viewers that a mobile service is being developed for those with limited computer specifications or difficulty in setting up the environment.

05:02

🎨 Using Tailor for Image Correction and Enhancement

This paragraph explains how to use the Tailor extension with the Text-to-Image feature. It details the process of enabling Tailor and selecting the correction model, which is responsible for detecting areas like faces or hands that need adjustment. The recommended model for correcting human faces and hands is from the YV8N series. The script also covers how to input prompts for specific corrections, such as detailing the fingers, and how to use negative prompts to prevent unwanted transformations. It demonstrates the before and after effects of using Tailor, noting improvements in the number of fingers and overall silhouette. Additionally, it provides information on how to adjust Tailor's settings for precision, including the number of models to apply and options for saving preview images and pre-correction images.

10:04

🛠️ Tailor Settings and Compatibility with SDXL

The final paragraph discusses the settings for Tailor, explaining the purpose of saving pre-correction images and the option to apply corrections only to selected script parts. It also touches on the ability to use Tailor with other extension features for enhanced results. The script confirms that Tailor is compatible with the stable diffusion web UI, even in versions that utilize SDXL, although it notes potential limitations when using systems with minimal VRAM. It acknowledges the increasing hardware requirements for image generation AI and mentions an upcoming web content project that will allow users without a graphics card to utilize the stable diffusion web UI. The script concludes by thanking viewers for watching and hints at future detailed videos on using Tailor in conjunction with other extensions.

Mindmap

Keywords

💡AIイラスト

AIイラストとは、人工知能を用いて自動生成されたイラストを指します。このビデオでは、AIが生成するイラストの顔や手などの細部が自然でなく崩れている問題を改善することができる拡張機能「テーラー」について解説しています。AIイラストは、テキストからイメージを生成するプロセスで作られるため、自然な表現とは異なる特徴を持つことがあります。

💡テーラー (Detailer)

テーラーは、AIが生成するイラストの細部、特に顔や手の変形を自動的に修正する拡張機能です。この機能は、自動で見つけて修正することが可能で、プロンプトを併用することで修正の精度を上げることもできます。テーラーは、Stable Diffusion WebUIで使用され、生成されたAIイラストの質を向上させるための重要な役割を果たします。

💡プロンプト (Prompt)

プロンプトとは、AIに指示を与えるためのテキストや文言を指します。AIイラストを生成する際には、プロンプトを用いて生成したいイラストのスタイルや内容を指定します。テーラーを使用する場合にも、プロンプトを入力して修正したい部位をAIに指示することができます。

💡Stable Diffusion WebUI

Stable Diffusion WebUIとは、Stable Diffusionという画像生成AIをウェブブラウザから操作するためのユーザーインターフェースです。このインターフェースを通じて、テキストからAIイラストを生成し、拡張機能を用いてその品質を向上させることができます。

💡VRAM (Video RAM)

VRAMとは、ビデオカードに搭載されたメモリのことであり、画像生成AIのスペック要件の一つです。VRAMは、AIが生成する高解像度な画像データを処理するために必要とされます。ビデオスクリプトでは、VRAMが不足していると、テーラーによる修正効果が期待通りに現れなくなる可能性があると説明しています。

💡インストール (Installation)

インストールとは、ソフトウェアやアプリケーションをコンピュータにセットアップし、使用できるようにすることです。ビデオでは、テーラー拡張機能をStable Diffusion WebUIに追加する手順について説明しており、これはAIイラストの修正機能を利用するために必要です。

💡拡張機能 (Extension)

拡張機能とは、既存のソフトウェアに追加の機能や機能性を提供するプログラムです。このビデオでは、テーラーという拡張機能を使用してAIイラストの品質を改善することができました。拡張機能は、ソフトウェアの柔軟性や応用範囲を広げるために役立ちます。

💡修正 (Correction)

修正とは、誤りや不備を修正することで、品質を向上させるプロセスです。ビデオでは、AIが生成するイラストの顔や手の変形を自動的に修正する機能について説明しており、これはAIイラストの完成度を高めるために不可欠なプロセスです。

💡スペック (Specification)

スペックとは、コンピュータやデバイスの性能を示す規格や詳細な情報です。ビデオでは、Stable Diffusion WebUIを使用するために必要なスペックについて触れており、特にVRAMの容量が重要な要件とされています。

💡エクステンションズ (Extensions)

エクステンションズとは、Stable Diffusion WebUIで使用できる拡張機能のことを指します。テーラーは、エクステンションズとして追加され、AIイラストの生成プロセスに組み込まれます。エクステンションズは、ユーザーがより高度な操作やカスタマイズを行えるようにするツールです。

💡インペイント (Inpainting)

インペイントとは、画像の欠けた部分や不要な要素を自動的に埋めるプロセスです。ビデオでは、テーラーがAIイラストの修正に類似の機能を提供していると説明しており、これは画像の自然さと質を向上させるために役立ちます。

Highlights

テーラーは顔や手の崩れを自動で見つけて修正することが可能

顔の表情を変えることも可能

画像生成AIの要求スペックがどんどん大きくなる傾向

VRAM12GBが推奨スペック

テーラーは修正箇所を自動で検出して形を改善して修正してくれる拡張機能

プロンプトを併用することで補正の精度を上げられる

スマホからでもグラボがないパソコンからでもステーブルディフュージョンWEBUIが楽しめる

インストールfromURLを使ってGHUBからダウンロードする方法

テーラーのインストールと使用方法の解説

テーラーの効果を反映して生成された画像の指の本数や爪が整った

ディテイラーの設定で一度に修正する場所の数を変更できる

セーブマスクプレビューズで検出と補正する範囲を可視化

アプライandリスタートUIでインストールが終わる

ディテイラーはSDXLでも使えるが、グラボが12GBでギリギリ使える状態になる

ディテイラーを使用する際には、VRAMの容量が十分に確保されている必要がある

年内中に完成する予定のWebコンテンツでグラボがないパソコンやスマホでもステーブルディフュージョンWEBUIが利用可能