Stable Diffusion 零基礎新手入門!Part 2 - 提示詞技巧 & 算圖參數簡介

PAPAYA 電腦教室
20 Nov 202312:05

TLDR本视频为Stable Diffusion零基礎新手入門系列的第二部分,主要介绍了提示词技巧和重要算图参数。讲解了如何使用关键字和逗号分隔来生成图片,以及如何设置图片尺寸以获得最佳品质。介绍了Stable Diffusion 1.5和新模型Stable Diffusion XL (SDXL)的区别,以及如何使用Refiner和VAE模型来优化图像细节和清晰度。还分享了提升算图效果的技巧,包括具體的Prompt构造、权重调整、取样方法和步数的选择,以及如何通过Upscaler和img2img功能放大图像。

Takeaways

  • 📝 提示詞(Prompt)是使用Stable Diffusion生成图片的关键,类似于使用Google搜索。
  • 🖼️ 在Stable Diffusion 1.5中,建议生成图片的尺寸与训练时使用的512 x 512像素相近,以保持较好的品质。
  • 🚫 Negative Prompt(反向提示)用于指定不希望在图片中出现的元素,有助于优化生成结果。
  • 🆕 Stable Diffusion XL(SDXL)模型允许用户用更少的提示詞生成更高品质的图片。
  • 🔗 官方提供了Refiner和VAE两个模型,分别用于增加影像细节和提升图片的清晰度及色彩饱和度。
  • 📌 使用SDXL时,建议调整生成图片的尺寸至1024 x 1024像素,以匹配模型训练的图形尺寸。
  • 🔄 Batch Count和Batch Size参数影响每次算图生成的图片数量和计算的张数,应根据硬件资源合理设置。
  • 🎨 好的Prompt应包含具体细节,SDXL对自然语言的理解能力较高,可以减少关键词的使用。
  • 🌟 艺术家的名字和画作风格在Prompt中具有较大影响力,可以显著改变生成图片的风格。
  • 🔄 Seed参数控制图片生成的初始状态,固定Seed值可以使修改后的Prompt产生风格一致的图片。
  • ⚖️ 调整关键字的权重值可以细微控制元素在图片中的出现频率和重要性。

Q & A

  • Stable Diffusion 1.5版本在生成图片时推荐的尺寸是多少?

    -Stable Diffusion 1.5版本在生成图片时推荐的尺寸是512 x 512像素,因为该模型就是使用这个尺寸的图片进行训练的。

  • 在使用Stable Diffusion时,如何告诉AI我们不希望在图片中出现的元素?

    -可以使用Negative Prompt(反向提示)功能来告诉Stable Diffusion在图片中不希望出现的元素,例如不想在街景中出现任何车辆等。

  • Stable Diffusion XL模型(SDXL)相比于1.5版本有什么改进?

    -SDXL模型使用更少的Prompt就能生成品质更好的图片,它是基于1024 x 1024像素的图形进行训练的,因此能呈现更细腻且精致的细节。

  • Refiner模型和VAE模型分别有什么作用?

    -Refiner模型可以在生成的图片上加入更多的影像细节,而VAE模型则用来提升图片的清晰度和色彩饱和度。

  • 如何使用SDXL模型生成图片?

    -要使用SDXL模型生成图片,需要将SDXL的模型文件和Refiner文件下载并放置到Stable Diffusion安装位置的对应文件夹中,然后回到Automatic1111界面,点击「重新整理」的按钮,从菜单中载入SDXL的模型。

  • 在Stable Diffusion中,如何通过调整Prompt中的关键字权重来影响图片的生成结果?

    -可以通过在关键字两侧添加圆括号或方括号来调整权重,圆括号增加权重,方括号减少权重。也可以通过按住Ctrl键并使用上下方向键直接用数值来调整权重。

  • Seed参数在Stable Diffusion中的作用是什么?

    -Seed参数决定了图片生成的初始状态。当Seed值为-1时,它会随机决定初始状态,即使使用相同的Prompt,生成的图片也会不一样。通过点击「回收」按钮可以固定Seed值,从而在修改Prompt后保持画面构图的一致性。

  • 如何使用Upscaler放大器来提升图片的分辨率?

    -可以将原始尺寸的图片送到Extras标签,选择一个Upscaler放大器,然后按下Generate来生成高分辨率的图片。对于照片或写实风格的画作可以使用R-ESRGAN 4x+,对于动漫风格的图片可以使用标注Anime6B的放大器。

  • CFG Scale参数在Stable Diffusion中的作用是什么?

    -CFG Scale参数用来控制AI绘图时的创造力。数值越低,生成的图像包含的创意和变化越多,但与输入的Prompt关联性也越少。反之,数值越高,AI会更严格地遵循Prompt,但图片的艺术性和多样性会变差。

  • 在Stable Diffusion中,如何使用img2img功能来放大图片?

    -可以通过将图片传送到img2img(图生图)的标签,指定二次绘制时的缩放倍数和降噪强度,然后按下「产生」,Stable Diffusion会根据原图进行二次重绘来达到放大影像的目的。

  • 如何通过Hires.fix功能一键生成高分辨率的图片?

    -可以在「文生图」的页面启用Hires.fix(高分辨率修复),指定放大的倍数和放大器的类型,重绘次数设为大约Sampling Steps的一半,降噪强度设小一点以维持画面的一致性,然后按下「产生」,Stable Diffusion就能一次性完成整个过程,直接生成高分辨率的图片。

  • 在Stable Diffusion中,如何使用提示词来生成具有特定艺术风格的作品?

    -可以在提示词中加入艺术家的名字或特定的艺术风格,例如在Prompt后面加上Comic Book Style会生成美漫风格的画作,而Flat Vector Illustration则会产生向量插画的风格。

Outlines

00:00

🎨 Introduction to Prompt Techniques and Parameters in Stable Diffusion 1.5

This paragraph introduces the concept of prompts in Stable Diffusion 1.5 (SD 1.5), comparing it to using Google search with multiple keywords separated by commas. It emphasizes the importance of using the recommended image dimensions (512x512 pixels) for optimal quality. The video also discusses the limitations of SD 1.5 compared to Midjourney, noting the need for more detailed prompts to achieve quality images. The concept of Negative Prompt is introduced, allowing users to specify elements they do not want in the generated images. The video then transitions to discussing the improvements made in the new Stable Diffusion XL (SDXL) model, which allows for better image generation with fewer prompts. It provides instructions on downloading and installing the SDXL model, as well as additional models like Refiner and VAE to further enhance image quality.

05:04

📝 Tips for Crafting Effective Prompts in Stable Diffusion XL

This paragraph delves into the art of crafting effective prompts for the Stable Diffusion XL (SDXL) model. It likens a good prompt to storytelling, emphasizing the need for specificity and clarity. The video highlights the increased understanding of natural language by the SDXL model, which allows for more straightforward prompts without the need for excessive keywords. The influence of certain words, such as artist names and art styles, is discussed, with examples provided. The concept of Seed value is introduced, explaining its role in the variability of generated images. The paragraph also covers the importance of adjusting keyword weights and explores various parameters like Sampling Method, Sampling Steps, and CFG Scale, explaining their impact on the generation process and image quality.

10:05

🔍 Methods for Upscaling Images in Stable Diffusion

The final paragraph focuses on methods for upscaling images generated by Stable Diffusion. Two primary methods are discussed: using an Upscaler through the Extras tab, with options like R-ESRGAN 4x+ for photos and realistic art, and Anime6B for anime-style images; and using the img2img feature for a secondary drawing process to放大 images. The paragraph explains how to specify the scaling factor and denoising strength for img2img, aiming to maintain the content of the original image. A simplified workflow with Hires.fix for generating high-resolution images in one step is also introduced, offering users a convenient way to produce detailed and high-quality outputs.

Mindmap

Keywords

💡Stable Diffusion

Stable Diffusion是一个基于深度学习的图像生成模型,能够根据用户输入的提示词(Prompt)生成相应的图像。在视频中,Stable Diffusion 1.5 (SD 1.5) 和 Stable Diffusion XL (SDXL) 被提及,其中SDXL是更新的模型,能够用更少的提示词生成更高质量的图像。

💡提示词 (Prompt)

提示词是用户输入给Stable Diffusion模型的一串描述性文本,用于指导模型生成图像。在视频中,提示词的编写技巧被强调,比如使用逗号分隔关键字,以及如何通过具体描述来提高图像生成的质量。

💡算图参数

算图参数是指在使用Stable Diffusion模型生成图像时可以调整的各种设置,这些参数影响图像的生成效果和质量。视频中介绍了如取样方法、取样步驟、CFG Scale等算图参数,并通过实例展示了如何调整这些参数来优化生成的图像。

💡Negative Prompt

Negative Prompt是Stable Diffusion模型中的一个功能,允许用户指定在生成的图像中不希望出现的元素。这可以帮助用户更精确地控制最终图像的内容,避免不期望的特征出现在结果中。

💡Refiner

Refiner是Stable Diffusion的一个附加模型,它可以在已有图像的基础上增加更多的细节,提高图像质量。Refiner通过分析输入的图像,生成一张具有更高清晰度和更丰富细节的新图像。

💡VAE

VAE是另一种用于优化图像的模型,专注于提升图像的清晰度和色彩饱和度。VAE通过特定的算法处理图像,使得生成的图像在视觉上更加逼真和生动。

💡Batch Count和Batch Size

Batch Count和Batch Size是Stable Diffusion中用于控制一次生成多张图像的参数。Batch Count指的是一次性生成图像的数量,而Batch Size指的是一次计算过程中生成的图像张数。这些参数的调整可以影响生成图像的速度和质量,以及对硬件资源的需求。

💡Seed

Seed是Stable Diffusion中用于控制图像生成初始状态的参数。当Seed的值设定为-1时,系统会随机决定图像的初始状态,即使使用相同的提示词,生成的图像也会有所不同。通过固定Seed值,用户可以在修改提示词时保持图像的初始构图不变。

💡权重调整

在Stable Diffusion中,用户可以通过调整提示词中关键字的权重来影响图像生成的结果。权重的调整可以通过添加圆括号或方括号来实现,不同数量的括号代表关键字影响力的增加或减少。此外,还可以直接使用数值来调整权重,以更精确地控制图像的细节。

💡Upscaler

Upscaler是用于放大图像的工具,它通过不同的算法来提高图像的分辨率。在视频中提到了几种Upscaler,如R-ESRGAN 4x+和Anime6B,分别适用于放大照片、写实风格画作和动漫风格的图像。使用Upscaler可以在保持图像质量的同时,得到更高分辨率的图像。

💡Hires.fix

Hires.fix是Stable Diffusion中的一个功能,用于生成高分辨率的图像。通过指定放大倍数、放大器类型和重绘次数等参数,Hires.fix可以简化生成高分辨率图像的流程,直接产生清晰、细节丰富的大图。

Highlights

Stable Diffusion 1.5 使用提示詞生成圖片,類似於使用 Google 搜索關鍵字。

生成圖片的長、寬可以在設定中調整,建議接近訓練時的 512 x 512 像素以獲得較好品質。

Stable Diffusion 需要較多的畫質關鍵字來優化算圖結果,與 Midjourney 不同。

Negative Prompt 用於指定圖片中不希望出現的元素。

Stable Diffusion XL (SDXL) 模型用更少的提示詞生成品質更好的圖片。

SDXL 模型使用 1024 x 1024 像素的圖形進行訓練。

Refiner 和 VAE 模型用於優化圖片的細節、清晰度和色彩飽和度。

使用 Refiner 進行圖生圖時,可以調整「降噪強度」來控制圖片的修改幅度。

好的提示詞應該具體描述人、事、時、地、物,以提高畫質。

藝術家名字和畫作風格在提示詞中具有較高的影響力。

Seed 值控制圖片生成的初始狀態,相同 Seed 值下修改 Prompt 可產生穩定的構圖。

調整關鍵字的權重值可以影響元素在畫面中的出現頻率和程度。

不同的 Sampling Method 影響圖片的精確度、隨機性和算圖速度。

Sampling Steps 決定 AI 繪製圖片的步驟數量,影響畫質和算圖時間。

CFG Scale 控制 AI 繪圖時的創造力,低值增加創意,高值增加與提示詞的關聯性。

使用 Upscaler 可以放大圖片,提高解析度,適用於不同風格的圖片。

二次繪製可以通過 img2img 功能來放大圖片並保持細節。

Hires .fix 功能可以一鍵生成高解析圖片,結合了放大和重繪流程。

下一期影片將介紹 SDXL 以外的特殊風格繪圖模型和 Automatic1111 的擴充功能。