最强测评!StableDiffusion3 VS Midjourney VS DALL-E3 VS Playground2.5 四款当前最热AI到底谁是王者?多角度出图对比测试|SD3 API购买方法

氪學家
29 Apr 202410:54

TLDR本期视频进行了StableDiffusion3与Midjourney、DALL-E3、Playground2.5四款AI绘画工具的出图对比测试。通过人物、二次元、超现实、语义理解等多角度的测试,发现StableDiffusion3在文字还原、写实风格、超现实风格等方面表现不俗,但价格较高,性价比不如Midjourney和Playground2.5。视频中还展示了如何为StableDiffusion3的API充值,以及如何将SD3部署到ComfyUI中。最终,视频建议观众根据实际需求选择最合适的AI绘画工具。

Takeaways

  • 💰 StableDiffusion3(SD3)目前仅通过API提供服务,价格不低,10美元可购买1000积分,每张图约需6.5积分,折合人民币约5毛钱。
  • 🔍 视频对比了SD3、Midjourney、DALL-E3和Playground2.5四款AI绘画工具,从人物、二次元、超现实、语义理解等多个角度进行出图测试。
  • 🚀 SD3在出图速度上由于调用API而不占用本地算力,因此出图速度最快。
  • 🎨 在构图和美观性上,Playground2.5表现最佳,Midjourney紧随其后,DALL-E3写实风格更重。
  • 📜 文字还原程度方面,SD3和Midjourney都较好地还原了文字,而DALL-E3只还原了数字。
  • 🚫 SD3和DALL-E3在涉及裸背等敏感内容时,会模糊或拒绝出图,显示了它们对内容的限制更为严格。
  • 🤩 在写实风格和面部特写方面,SD3和Midjourney的细节处理被认为是最好的。
  • 🎭 对于二次元风格的测试,SD3在构图上表现最佳,Midjourney在真实感上排名第二。
  • 🌐 在超现实风格的测试中,Playground2.5和SD3的表现被认为是最符合提示词且有意境的。
  • 🧐 在语义理解测试中,SD3和DALL-E3在处理复杂提示词时表现更好,尤其是SD3在颜色和文字的理解上展现了优势。
  • 🕵️‍♂️ 在角色设计测试中,Midjourney和SD3的表现不错,但DALL-E3因版权问题拒绝出图,Playground2.5在布局上较为常规。
  • 👋 在手部特写测试中,Midjourney的表现最佳,而SD3和DALL-E3在手指细节上出现了问题。

Q & A

  • StableDiffusion3的API价格是多少,以及它如何计算出图成本?

    -StableDiffusion3的API价格是10美元可以购买1000积分,每张图需要6.5积分,因此每张图的成本大约是5毛钱。

  • 在视频测试中,哪一款AI在出图速度上是最快的?

    -在视频测试中,StableDiffusion3因为调用的是API,所以不占用本地算力,是出图速度最快的。

  • Midjourney在出图时有什么特点?

    -Midjourney在出图时一次能出四张图,虽然速度不是最快的,但在构图和美观上表现不错。

  • DALL-E3在处理写实风格图片时的表现如何?

    -DALL-E3在处理写实风格图片时,对写实风格的出图有一定的限制,比如在涉及裸背的内容时会拒绝出图,且在面部特写方面,相比于其他AI,它的表现一般,有一层很强的油腻感。

  • Playground2.5在美学模型方面的表现如何?

    -Playground2.5在美学模型方面表现出色,尤其是在构图和整体美观度上,即使在不涉及文字的情况下,它出的图也是最漂亮的。

  • StableDiffusion3在处理含有文字的图片时,效果如何?

    -StableDiffusion3在处理含有文字的图片时,能够对文字进行一定程度的还原,但在透视和文字与场景的融合度方面,相比其他AI,如Playground2.5,做得较差。

  • 在二次元风格的测试中,哪一款AI的构图最被看好?

    -在二次元风格的测试中,StableDiffusion3的构图被认为是最好的,其次是Midjourney。

  • Midjourney在处理超现实风格图片时有哪些特点?

    -Midjourney在处理超现实风格图片时,其画风与其他AI明显不同,且在某些情况下,比如玻璃效果的还原上,并没有做到很好。

  • DALL-E3在语义理解方面的表现如何?

    -DALL-E3在语义理解方面表现不错,尤其是在处理复杂或绕弯的提示词时,它和StableDiffusion3的表现更好。

  • 在角色设计测试中,哪款AI因为版权问题拒绝出图?

    -在角色设计测试中,DALL-E3因为版权问题拒绝出图。

  • 根据视频内容,哪款AI在手部特写测试中表现最好?

    -在手部特写测试中,Midjourney的表现最好,尽管如此,它在戒指位置的准确性上仍有改进空间。

  • 视频作者对于制作这种测试视频的态度是怎样的?

    -视频作者表示,虽然这种测试视频看起来很吸引人,但实际上制作过程非常费劲,他开玩笑说以后如果再做这种视频他就是狗,表达了对制作过程的不满和疲惫。

Outlines

00:00

📈 Introduction and SD3 API Testing

The video begins with the host expressing surprise at the rapid response to their previous video on StableDiffusion3 (SD3), which led to this follow-up. They discuss the current methods to access SD3 for free and the high demand that prompted a rapid update. The host then covers the process of purchasing credits for the SD3 API, using a VISA credit card for the transaction. The video proceeds to a comparison test between SD3 and three other popular AI art models: Midjourney, DALL-E3, and Playground 2.5, across various categories including character, anime, surrealism, and semantic understanding. The host also provides information on how to find the prompts used in the video description and offers resources for those interested in deploying SD3 or experiencing other AI models.

05:00

🎨 AI Art Model Comparison and Testing

The video continues with a detailed comparison of the four AI art models based on specific prompts. The host evaluates the models on their ability to render images with text, real-life photorealism, anime style, surrealism, and semantic understanding. Each model's approach to handling prompts and generating images is critiqued, with attention to detail, composition, and adherence to the given instructions. The video also touches on the limitations and restrictions of the models, particularly regarding sensitive content. The host provides insights into the strengths and weaknesses of each model and shares their subjective opinions on the quality and accuracy of the generated images.

10:03

🔍 Conclusion and Future Perspectives

In the final paragraph, the host summarizes the findings from the video's tests, noting that while SD3 performed competitively against the other models, its cost-effectiveness is questionable given the price point. The host suggests that alternatives like Midjourney combined with Playground, or other StableDiffusion models, might currently offer better value. They also hint at potential future developments for SD3 and commit to keeping their audience informed. The video concludes with a humorous note about the challenges of creating such content and a call to action for viewers to like, subscribe, and follow the host's social media for updates.

Mindmap

Keywords

💡StableDiffusion3

StableDiffusion3(简称SD3)是一款AI绘画工具,它通过API提供服务,允许用户生成图像。在视频中,SD3与其他三款AI绘画工具进行了比较,以评估其性能和性价比。SD3在出图速度、文字还原度和写实风格方面表现出色,但在某些场景下,如手部细节的绘制,还存在挑战。

💡Midjourney

Midjourney是另一款AI绘画工具,以其出图的精美度和准确度而闻名。视频中提到,Midjourney在人物写实风格和二次元风格的出图上表现良好,但在某些情况下,如亚洲女孩的角色设计,其对提示词的理解和出图的画风更偏向欧美。

💡DALL-E3

DALL-E3是一款以语义理解能力著称的AI绘画工具。在视频中,DALL-E3在处理复杂语义提示词时表现出色,但在写实风格的出图上,如面部特写,其表现一般,且存在油腻感。同时,DALL-E3在版权问题上表现出较为严格的限制。

💡Playground2.5

Playground2.5是一个美学模型,以其出图的美观度而受到用户的喜爱。在视频中,Playground2.5在构图和美观上得到了高度评价,但在文字还原和某些超现实风格的场景理解上存在不足。

💡API购买方法

API购买方法指的是用户如何购买和使用StableDiffusion3的API服务。视频中详细介绍了通过StabilityAI官网进行API充值的步骤,包括登录、选择支付方式、输入银行卡信息以及支付过程。

💡出图速度

出图速度是指AI绘画工具生成图像所需的时间。视频中提到,由于SD3调用的是API,不占用本地算力,因此它的出图速度是最快的,这对于需要快速生成图像的用户来说是一个重要的考量因素。

💡写实风格

写实风格是指AI绘画工具生成的图像在视觉上接近现实世界的程度。视频中对几款AI绘画工具在写实风格的表现进行了比较,发现SD3和Midjourney在细节处理上更为优秀,而DALL-E3则在写实风格的表现上略显不足。

💡二次元

二次元通常指的是动漫、游戏等虚拟世界中的二维艺术风格。视频中提到,几款AI绘画工具在处理二次元风格的图像时,构图和真实感各有特点,SD3在构图上表现最佳,而DALL-E3在景深处理上更为合理。

💡超现实

超现实是指超越现实逻辑的艺术风格,常常包含梦幻或非现实元素。视频中测试了AI绘画工具对超现实风格场景的理解,Playground2.5在这一领域的测试中表现突出,能够很好地理解和表现超现实的提示词。

💡语义理解

语义理解是指AI绘画工具对用户输入的提示词的含义进行解析和理解的能力。视频中通过一系列测试来评估不同AI工具的语义理解能力,发现SD3和DALL-E3在处理复杂语义提示词时表现较好,而Midjourney在某些情况下出现了颜色错乱的现象。

💡角色设计

角色设计是指AI绘画工具根据用户提示生成具有特定特征和风格的角色图像的能力。视频中对几款AI绘画工具在角色设计方面的表现进行了比较,发现DALL-E3在版权问题上更为谨慎,而SD3和Midjourney在特定角色的设计上能够较好地满足用户需求。

Highlights

StableDiffusion3与Midjourney、DALL-E3和Playground2.5进行了多角度的出图对比测试

StableDiffusion3的API价格为10美元购买1000积分,每张图成本约0.5美元

StableDiffusion3在不占用本地算力的情况下,出图速度最快

Midjourney一次出四张图,速度最慢

Playground2.5在构图和美观上表现最佳

StableDiffusion3和Midjourney在文字还原程度上表现良好

DALL-E3在文字与场景融合度上做得最好

Playground2.5在没有画出文字的情况下,图片整体美观

StableDiffusion3在大场景加文字的融合上处理得更好

StableDiffusion3和DALL-E3对裸背等敏感内容进行了模糊或拒绝出图处理

Midjourney在真人写实风格中出现了多余胳膊的错误

StableDiffusion3和Midjourney在面部特写的细节上表现最佳

StableDiffusion3在二次元风格的构图上表现最佳

DALL-E3在手枪和人物景深关系的真实感上表现最合理

Playground2.5在超现实风格理解上表现最佳

Midjourney在复古照片风格把控上高于其他三家

StableDiffusion3在语义理解上表现最佳,尤其是在复杂提示词的处理上

DALL-E3在颜色理解上没有问题,但对风格的把控不如其他AI

StableDiffusion3在角色设计上出现了失误,而Midjourney的出图更符合亚洲女孩特征

Midjourney在手部特写的出图上细节最佳,但所有AI在地狱级难度的手部特写上仍有挑战

StableDiffusion3虽然性能出色,但性价比不是最高的选择,可以根据需求选择其他工具