【stable diffusion】画像からフィギュアからポーズを超絶簡単生成!3Dopen Pose! を試してみました。

藤原工務店
12 May 202309:56

TLDRこの動画は、Stable Diffusionを利用した画像からフィギュアのポーズ生成方法を紹介しています。WEBUIのオープンポーズ機能を使って、直感的に関節を設定し、細かく調整可能。GPUや画像から骨格検出を用いて棒人形を作成し、ハンドジェスチャープラグインで精度を上げる。3Dオープンポーズエディタで指の関節や顔のパーツを調整し、コントロールネットを用いてポーズを生成。最後に、ハイレゾフィックスやサイズ、補正オプションを設定し、完成した画像を生成します。

Takeaways

  • 😀 3D Open Poseツールを使用して、直感的に人形のポーズを設定し、GPUを使って骨格検出から人形を作成できます。
  • 🔧 WEBUIのオープンポーズを開いて、関節をクリックすることでリグを回し、望むポーズを作成することが可能です。
  • 👆 細かい調整が可能で、指の関節も設定でき、非常に細かなポーズ設定が行えます。
  • 📥 特定のプラグインを使用してハンドジェスチャーの精度を向上させることができ、生成の質が向上します。
  • 🔗 GitHubから必要なプラグインをインストールし、Open Poseの機能を活用するための手順が詳しく述べられています。
  • 🎨 ポーズエディタを利用して、顔や体の各パーツを自由に変形させることができ、様々な角度からのポーズを確認できます。
  • 🖼 生成されたポーズは、画像として出力し、詳細な設定を通じてさらに調整が可能です。
  • 💡 複数の試行を重ねることで、理想のポーズが得られ、さらに精度を高めるための調整が可能です。
  • ⚙️ 設定を変更し、コントロールネットを使用して、ポーズの影響力を調整しながら理想のイメージを生成します。
  • 🌟 WEBUIのオプションを駆使して、解像度の高い、美しい画像を生成するための方法が提供されています。

Q & A

  • 3Dオープンポーズを試した結果、どのような機能が特筆すべきですか?

    -3Dオープンポーズを使用することで、直感的に関節を配置し、細かく調整することができ、さらにハンドジェスチャープラグインで生成の精度を向上させることができます。

  • WEB UIのオープンポーズ機能を使うにあたり、最初に行うべきことは何ですか?

    -最初に行うべきことは、WEB UIを開いた上で、グランドメニューから3Dオープンポーズを選択することです。もしまだ反映できていない場合は、gitからWEB UIに入れてください。

  • オープンポーズのエクステンションをインストールするには、どのような手順を踏む必要がありますか?

    -エクステンションをインストールするためには、まずキットのオープンポーズページにある緑色のボタンを押してURLをコピーし、WEB UIのエクステンションズタブでfrom URLを選択し、フォームにURLをペーストしてインストールボタンをクリックします。その後、インストールができたらアプリ&リスタートUIをクリックします。

  • ポーズを設定する際、ボーンの関節をどのように操作しますか?

    -ボーンの関節はクリックしてリグを回すことで操作できます。これにより、腕や脚などの部位を自由自在に動かすことができます。

  • 3Dオープンポーズエディタでは、指の関節の調整がどのように特徴的ですか?

    -3Dオープンポーズエディタでは、指の関節まで細かく調整できることが特徴的です。これにより、より自然なポーズを設定することができます。

  • コントロールネットを設定する際、どのようなポイントに注意すべきですか?

    -コントロールネットを設定する際には、顔の部分に特に注意すべきです。頭が洋画した時に切れるようなポーズを避けるために、ボーンを適切に配置し、ウェイトの数値を調整することが重要です。

  • ポジティブプロンプトとネガティブプロンプトを設定する目的は何ですか?

    -ポジティブプロンプトとネガティブプロンプトを設定する目的是为了、生成される画像の内容をより正確に制御することです。ポジティブプロンプトは画像に反映させたい要素を、ネガティブプロンプトは排除したい要素を示します。

  • 画像生成時にハイレゾフィックスオプションを使用する効果は何ですか?

    -ハイレゾフィックスオプションを使用することで、構図の破綻を押えつつ高解像度の画像を生成することができます。

  • ジェネレートボタンをクリックする前に、どのような設定を調整することができます?

    -ジェネレートボタンをクリックする前に、サイズ、cfgスケール、ベストフェイス、サンプリングメソッド、appscaleなど、多种の設定を調整することができます。これらの設定を適切に調整することで、生成される画像の品質やスタイルをコントロールできます。

  • 3Dオープンポーズで画像から骨格を検出して棒人形を作成する機能はどのように使いますか?

    -画像から骨格を検出して棒人形を作成するには、WEB UIのオープンポーズを開いた上で、画像をドロップするかクリックしてアップロードします。その後、モデルからポーズに合わせて調整することで、画像を元に棒人形を生成することができます。

Outlines

00:00

🖥️ Introduction to 3D Open Pose Editor

The paragraph introduces the process of using the 3D Open Pose Editor in WEBUI. It explains how to access and set up the tool, including adjusting parameters and fine-tuning the pose of a 3D model. The user is guided through the steps of copying the URL from the kit's open pose page, installing the extension, and restarting the UI. The paragraph also covers the basics of manipulating the model's joints and limbs, and the importance of careful positioning to achieve the desired pose. Additionally, it mentions the features of the 3D Open Pose Editor, such as the ability to adjust the size of parts and the focus on finger joints. The user is encouraged to practice and become familiar with the interface to create a variety of poses freely.

05:01

🎨 Customizing Poses and Image Generation

This paragraph delves into the customization of poses and the generation of images using the 3D Open Pose Editor. It discusses the process of fine-tuning the pose by adjusting the influence of certain bones and weights. The user is shown how to brush up the generated images and use the ping-pong method to improve the quality. The paragraph also explains the importance of setting the correct rates and weights for different parts of the model to avoid issues like overlapping or incorrect positioning. Furthermore, it covers the use of control networks and prompts to guide the AI in generating images that match the desired outcome. The user is provided with tips on how to enhance the images and achieve a higher resolution, as well as how to use various options and settings to refine the final output.

Mindmap

Keywords

💡Stable Diffusion

Stable Diffusionは、画像生成のための高度なAI技術です。この技術は、大量のデータから学習し、新しい画像を生成することができます。ビデオスクリプトでは、Stable Diffusionを使用して、画像から人物のポーズを生成し、さらに詳細な画像を作成することが説明されています。

💡3D Open Pose

3D Open Poseは、画像から人物の骨格やポーズを検出する技術です。この技術を使うことで、画像の中の人物のポーズを分析し、3Dモデルとして再現することができます。ビデオスクリプトでは、3D Open Poseを使用して、画像から得られたデータを使って、より自然なポーズの生成や、細かい調整を行うことが説明されています。

💡WEBUI

WEBUIとは、Webを通じて利用できるユーザーインターフェースのことを指します。ビデオスクリプトでは、WEBUIを開くことで、3Dオープンポーズの機能を使用することができます。これは、ユーザーが直感的に関節を設定し、パラメーターを調整するインターフェースを提供します。

💡GPU

GPUは、Graphics Processing Unitの略で、グラフィック処理ユニットのことを指します。これは、コンピュータの中でグラフィックや画像の処理を担当するハードウェアです。ビデオスクリプトでは、GPUが使用されていることで、画像の生成や処理を高速化することが説明されています。

💡ハンドジェスチャー

ハンドジェスチャーとは、手の動きやポーズを示すジェスチャーのことを指します。ビデオスクリプトでは、3D Open Pose技術を使用して、画像から人物のハンドジェスチャーを検出し、再現することができます。

💡コントロールネット

コントロールネットとは、画像生成のプロセスにおいて、生成される画像をコントロールするための仕組みのことを指します。ビデオスクリプトでは、コントロールネットを使用して、生成される画像のポーズやパーツの配置を調整することができます。

💡プロンプト

プロンプトとは、コンピュータプログラムやAIが、特定のタスクを実行するために必要な入力や指示のことを指します。ビデオスクリプトでは、プロンプトを使用して、AIが画像を生成する際の基準や方向性を与えることが説明されています。

💡ハイレゾフィックス

ハイレゾフィックスとは、高解像度な修正や加工を行うことを指します。ビデオスクリプトでは、ハイレゾフィックスを使用して、生成された画像の品質を向上させ、細部まで正確に再現することができます。

💡VRAM

VRAMは、Video RAMの略で、グラフィックカードのメモリを指します。ビデオスクリプトでは、VRAMの容量が画像生成プロセスの品質や処理速度に影響を与えることが説明されています。

💡ブラッシュアップ

ブラッシュアップとは、既存のデータや画像を改善したり、詳細を追加することを指します。ビデオスクリプトでは、生成された画像をブラッシュアップして、品質や細部まで向上させることが説明されています。

💡デッサン人形

デッサン人形とは、絵画やデザインの勉強をする際に使用される、人間の体型やポーズを簡潔に表現したマネキンのことを指します。ビデオスクリプトでは、デッサン人形を使用して、人物のポーズを捉える練習をすることを例に挙げています。

Highlights

WEBUIのオープンポーズを試してみた

直感的な操作で関節を設定

パラメーター調整で細かくイジれる

GPUやバックエンドの最適化

画像から骨格検出と棒人形作成

ハンドジェスチャープラグインで生成精度アップ

3Dオープンポーズエディタの特徴

指の関節まで細かく調整可能

コントロールネットでポーズを調整

ポジティブとネガティブプロンプトの設定

ジェネレートボタンで期待通りの画像生成

ブラッシュアップと繊細化

ハイレゾフィックスで高解像度画像生成

ベストフェイスで顔の崩れを補正

アニメ系や実写系の設定

3Dオープンポーズでポーズのもとになる画像を抽出

最終的な成果と感想