利用Stable Diffusion打造AI电商模特图:操作分享

gravy
29 Apr 202313:19

TLDR本视频分享了如何利用Stable Diffusion技术打造AI电商模特图的五个步骤:首先在Photoshop中调整图片大小并生成遮罩;接着在Stable Diffusion中使用Controlnet控制模特姿势;然后通过inpainting技术进行细节调整;最后使用extra工具放大图片。视频中还介绍了如何使用Photoshop创建精确的遮罩,以及如何通过调整骨架和姿势使模特与衣服更贴合。此外,还提供了生成高质量AI模特图的参数设置和prompt技巧。

Takeaways

  • 🖼️ 使用Photoshop调整图片大小,为模特的脸和四肢留出空间。
  • 🎭 利用Photoshop生成图片遮罩,以100%保留衣服的原图。
  • 💡 使用controlnet控制模特的姿势,生成模特图。
  • 👗 通过inpainting技术调整细节,如模特的腿部和脸部。
  • 🔍 使用extra放大图片,以获得更高分辨率的输出。
  • 📐 调整画布大小后,用画笔将背景涂成白色,为后续步骤做准备。
  • 🔍 利用智能套索工具选取衣服形状,创建更准确的遮罩。
  • 🤳 在stable diffusion中使用chilloutmix模型,并设置多个control net。
  • 📐 在openpose调整骨架大小和姿势,使其与背景照片贴合。
  • 🖌️ 使用inpainting技术时,选择latent noise作为masked content,以生成与原图差异较大的内容。
  • 🔍 在生成图片前,耐心调整参数,如denoising strength和batch count,以获得最佳效果。

Q & A

  • AI电商模特图的制作过程中,为什么需要调整图片大小?

    -在制作AI电商模特图的过程中,调整图片大小是为了在图片中留出足够的空白区域,以便能够容纳模特的脸和四肢。这是为了确保模特的身体部位不会超出图片的边界,从而保证最终合成效果的自然和协调。

  • 使用Photoshop生成图片遮罩的目的是什么?

    -使用Photoshop生成图片遮罩的目的是为了创建一个精确的遮罩层,这样可以在不破坏原图的基础上,将衣服的形状准确地选取出来,并在后续步骤中使用。这样可以确保在AI合成模特图时,衣服的原图能够100%保留,提高最终图片的真实感和质量。

  • 在Stable Diffusion中使用controlnet控制姿势的目的是什么?

    -在Stable Diffusion中使用controlnet控制姿势的目的是为了生成与原图衣服更贴合的模特姿势。通过设置多个control net,一个用于控制模特的骨架姿势,另一个用于贴合原图的衣服,这样可以确保合成的模特图在姿势和衣服的贴合度上更加自然和逼真。

  • 为什么在inpainting过程中需要调整细节?

    -在inpainting过程中需要调整细节是为了修复或改善AI生成的模特图中不完美的地方,如脸部、四肢等。通过手动涂抹需要重绘的区域,并调整相应的参数,可以生成更加符合预期效果的模特图,提高图片的整体质量和逼真度。

  • 使用extra放大图片的目的是什么?

    -使用extra放大图片的目的是为了提高图片的分辨率,使其在放大后依然保持清晰度和细节。这对于电商模特图来说尤为重要,因为高分辨率的图片可以更好地展示服装的细节,提升用户的购物体验。

  • 在调整图片大小时,为什么要先调整画布大小而不是直接调整图像大小?

    -在调整图片大小时,先调整画布大小而不是直接调整图像大小,是为了在图片周围留出空白区域,这样可以在后续步骤中添加模特的脸和四肢,而不会影响原图的内容。如果直接调整图像大小,可能会导致图片内容的裁剪或变形。

  • 在创建衣服遮罩时,为什么要用黑色的画笔进行涂抹?

    -在创建衣服遮罩时使用黑色的画笔进行涂抹,是为了在衣服的形状上创建一个精确的遮罩。黑色部分在遮罩中代表不透明,可以确保在后续的合成过程中,衣服的原图被完整保留,而不会被其他元素覆盖或干扰。

  • 为什么在Stable Diffusion中使用多个control net?

    -在Stable Diffusion中使用多个control net是为了更精细地控制模特的姿势和衣服的贴合度。一个control net用于控制模特的骨架姿势,另一个用于控制衣服的贴合,这样可以生成更加自然和逼真的模特图。

  • 在inpainting过程中,为什么遮盖的地方是画面里白色的部分?

    -在inpainting过程中,遮盖的地方是画面里白色的部分,因为白色代表需要重绘的区域。在遮罩层中,黑色通常表示保留的区域,而白色表示需要AI填充或重绘的区域。这样可以确保AI只对指定的部分进行修改,而保留其他部分的原貌。

  • 为什么在生成图片时,denoising strength要设置得较高?

    -在生成图片时,denoising strength设置得较高是为了增加绘图的随机性,从而生成与原图不同的人物形象。如果denoising strength设置得太低,生成的图片可能会过于接近原图,导致缺乏创造性和多样性。

  • 在挑选生成的图片时,为什么要进行多轮挑选和调整?

    -在挑选生成的图片时进行多轮挑选和调整是为了确保最终选择的图片在质量上是最佳的。由于AI生成的图片可能存在各种不完美的地方,如脸部歪曲、四肢变形等,通过多轮挑选和针对性的调整,可以逐步优化图片,直至达到满意的效果。

Outlines

00:00

🎨 Photoshop Image Sizing and Masking

The first paragraph introduces the process of using Photoshop to adjust the size of an image and create a mask for the clothing. The speaker explains that the original image needs resizing to accommodate the model's face and limbs, which involves adjusting the image size and canvas size, and then painting the background white. Next, a mask for the clothing is generated using the Smart Lasso tool to select and copy the clothing shape onto a new layer, and then painting it black to create an accurate mask that preserves the original clothing details.

05:02

🤖 ControlNet and Stable Diffusion for Pose and Clothing

The second paragraph details the use of ControlNet and Stable Diffusion to control the model's pose and apply clothing to the model. The process involves setting up multiple ControlNets in the Stable Diffusion model for skeleton control and clothing fit. The speaker uses the Chilloutmix model and explains the necessity of using two ControlNets: one for the skeleton and another for the Candy model to ensure the clothing fits well. The Openpose tool is then used to adjust the model's pose to match the background image. The paragraph also covers the steps for uploading the original image and mask to the image-to-image interface, adjusting parameters such as resize mode, mask mode, and denoising strength, and setting up the control net and canny edge detection for a more accurate fit.

10:02

🖌️ Inpainting and Final Touches with Extra

The third paragraph focuses on the final stages of image editing using inpainting and Extra for image resizing. It begins with sending the image to inpaint to correct the model's legs, adjusting the prompt and parameters such as control net, sampling steps, and denoising strength. The process is repeated to restore the face, with special attention given to avoiding hair obstructions and distortions. The paragraph also mentions the potential need for further adjustments to the hands, combining inpainting with control net adjustments for precise positioning. Finally, the Extra tool is introduced for resizing the image, marking the end of the video tutorial.

Mindmap

Keywords

💡Stable Diffusion

Stable Diffusion是一种人工智能图像生成技术,它可以根据文本提示生成高质量的图像。在视频中,Stable Diffusion被用来创建穿着特定服装的AI模特图,这是实现虚拟试衣和电商展示的关键技术。

💡inpainting

inpainting是一种图像处理技术,用于填充图像中的缺失部分。在视频中,inpainting用于重绘模特的脸部和四肢,以实现模特与服装的自然融合。

💡Photoshop

Photoshop是一款广泛使用的图像编辑软件,它提供了丰富的图像处理功能。在视频中,Photoshop被用于调整图片大小、生成图片遮罩等前期准备工作,为后续的AI图像生成打下基础。

💡controlnet

controlnet是Stable Diffusion中的一个功能,用于控制生成图像中人物的姿势。在视频中,通过设置多个controlnet,可以调整模特的姿势,使其与服装照片更加贴合。

💡extra

extra在视频中指的是使用某种工具或技术来放大图片,以提高图像的分辨率和细节。这是图像处理的最后步骤,确保最终输出的AI模特图具有高清晰度。

💡智能套索

智能套索是Photoshop中的一个选择工具,它可以根据颜色和纹理自动选择图像中的特定区域。在视频中,智能套索被用来选取衣服的形状,以便生成衣服的遮罩。

💡骨架控制

骨架控制是指通过编辑人物骨架来调整其姿势和动作的过程。在视频中,骨架控制用于确保AI模特的姿势与原图服装的姿势相匹配,从而提高最终图像的真实感。

💡Candy模型

Candy模型在视频中被用作一个参考,以确保模特与原图的衣服更加贴合。尽管视频没有详细解释Candy模型的具体细节,但它可能是用于指导AI生成更准确服装效果的模型或算法。

💡Openpose

Openpose是一个用于关键点检测的计算机视觉工具,它可以识别图像中人物的骨架和姿势。在视频中,Openpose被用来调整模特的姿势,以便与原图背景和服装相匹配。

💡遮罩

遮罩是图像编辑中的一个术语,指的是用来隐藏或显示图像中特定部分的图层。在视频中,遮罩用于保留衣服的原图,同时允许对模特的其他部分进行编辑和重绘。

💡latent noise

latent noise在AI图像生成中指的是在生成过程中添加的随机噪声,它可以用来生成与原图差异较大的新图像。在视频中,选择latent noise作为masked content,意味着在重绘遮罩区域时,希望生成与原图有明显区别的模特人物。

Highlights

使用Stable Diffusion技术创建AI电商模特图,通过五个步骤实现服装照片与模特的完美融合

第一步使用Photoshop调整图片大小,为模特的脸和四肢留出空间

第二步通过Photoshop生成图片遮罩,确保衣服原图的100%保留

第三步使用controlnet控制模特的姿势,生成模特图

第四步利用inpainting技术进行细节调整,优化模特的脸部和四肢

最后一步使用extra放大图片,完成最终的AI模特图

在Photoshop中调整画布大小并涂白背景,为后续步骤做准备

使用智能套索工具选取衣服形状并创建遮罩,提高准确性

在Stable Diffusion中设置多个control net以控制模特姿势和衣服贴合度

通过openpose调整骨架大小和姿势,使其与背景照片贴合

上传照片和遮罩到image to image界面,进行进一步编辑

选择合适的参数设置,如resize mode、mask mode和denoising strength,以生成高质量的模特图

使用latent noise作为masked content,以便在遮盖区域生成具体的模特人物

在生成过程中,选择效果好的照片进行下一步的细节调整

对选定的照片进行inpainting,重绘模特的腿部和脸部,以修正不完美之处

结合controlnet微调手部姿势,以达到更自然的效果

使用extra工具放大图片尺寸,完成AI模特图的最终制作

在collab中运行Stable Diffusion模型,节省本地计算资源

挑选合适的prompt以指导AI生成符合要求的模特图

通过多次迭代和细节调整,最终获得高质量的AI电商模特图