目錄
前言
SD 1.5?SDXL?LCM?SD3?Pony Diffusion?Flux? 這些都是什麼咚咚?
你知道嗎?
不是每種擴散模型 (Diffusion Model) 都叫做 Stable Diffusion,
底下還有千千萬萬種的模型唷,想知道的話就一起來看看吧!
打 ⭐ 就代表是重要版本,跟前一代比有著極大的躍進 🌈
Stable Diffusion 重要基礎模型版本一覽
SD 1.4
Stability AI 出品,開山元祖,
是第一個被廣泛使用的 Stable Diffusion 模型。
⭐ SD 1.5
還記得生出超逼真美女圖的 ChilloutMix 嗎?
這是最常見的元老模型之一,
SD 1.5 的賣點在於要求的算力很低,且效果相當堪用,
相關資源超級多。最推薦的 AI 繪圖入門款。
🌈 真實系模型推薦:
Dreamshaper: https://civitai.com/models/4384/dreamshaper
🌈 動漫系模型推薦:
GhostMix ( 注意,GhostMix 不能商用 ): https://civitai.com/models/36520/ghostmix?modelVersionId=76907
ReV Animated:https://civitai.com/models/7371/rev-animated
✅ 可商用
✅ 可部署成線上生成服務
SD 2.0
SD 1.5 的升級版,但是沒激起甚麼水花 XD。
⭐ SDXL 1.0
相較於 SD 1.5 的大躍進,無論是手或是軀體的正確性都改善很多。
相關分支包括 SDXL Hyper、SDXL Lightning、SDXL Turbo。
🌈 真實系模型推薦:
Juggernaut XL:https://civitai.com/models/133005/juggernaut-xl (也有 1.5 版本)
🌈 動漫系模型推薦:
NoobAI-XL (NAI-XL): https://civitai.com/models/833294/noobai-xl-nai-xl
✅ 可商用
✅ 可部署成線上生成服務
⭐ Pony Diffusion
基於 SDXL 的分支,由 AstraliteHeart 貢獻,畫動漫相當知名的系列模型,注意,他雖然是 SDXL 架構但是跟 SDXL 的 LoRA 等並不兼容,必須要用專用的 Pony LoRA。
最大特色是 prompt 裡面帶有 score_9
、score_8
等字眼,這代表要求作品要有比較好的品質,其實就傳統的 best quality
跟 masterpiece
差不多 XD
原始模型
Pony XL: https://civitai.com/models/257749/pony-diffusion-v6-xl
知名衍生模型:
Perfect Pony XL: https://civitai.com/models/439889/prefect-pony-xl
⭐ Illustrious XL
基於 SDXL 的分支,由韓國公司 OnomaAI 開發,畫動漫相當知名的系列模型。
原始模型
Illustrious XL: https://civitai.com/models/795765/illustrious-xl
知名衍生模型
NTR MIX: https://civitai.com/models/926443/ntr-mix-or-illustrious-xl-or-noob-xl (Noob-AI + Illustrious-XL)
SD 3
聽說是還不錯,不過由於限制太多,SD 3 最終還是成了棄子。
一開始的 Creator's License 是給年收入低於 100 萬美元、機構資金低於 100 萬美元、月活躍使用者少於 100 萬的創作者和開發者使用。
但但但…Creator's License 每月要收 20 美元,就算你部署在自家的電腦上都還是要收錢。而且你每個月只能生 6000 張圖。
SD 的受眾本來就是開源 (免費) 派,哪受的了這種氣,
因此 SD 3 被輿論強烈攻擊後就再也沒有水花了 (甚至在 Civitai 上面都沒了影子,慘)。
❌ 不可商用,需申請 self-hosting license
❌ 不可部署成線上生成服務
LCM
其實不是一種模型,號稱 4 步就能算完的超極速 SD 加速技術,需要搭配特定的 sampler 以及較低的 CFG Scale,
著名的 krita 的實時 AI 繪畫的效果底層就是用這個,SD 1.5 跟 SDXL 皆可用 LCM 加速,另外也常拿來跟 Animatediff 等開源圖轉動畫的框架做搭配。
- 優點:快,真的快
- 缺點:圖片品質較低
⭐ Flux
由 Black Forest Lab 出品,最近大紅大紫的高品質模型 (當然吃的 VRAM 也超多),
其實 Flux 有分三種版本,並不是每一種都能商用,開源的可以在這裡下載。
開源
- Flux Schnell:品質相較最差,但限制最少
- Flux Dev: 品質不錯,不是大企業的話可商用
這邊補充一下 Flux Dev 的 license 疑慮, 其實「個人」跟「小企業」是真的可以商用的,官方講的很清楚。
以下節錄自官方說明。
適用於:
個人藝術項目:
-> 適合那些希望嘗試和創作獨特作品而不用擔心許可限制的藝術家。
小規模商業銷售:
-> 非常適合銷售帶有 Flux 生成圖像的訂製商品(例如 T shirt 或海報)的小型企業或個人。
Personal Artistic Projects:
-> For artists looking to experiment and create unique pieces without worrying about licensing constraints.
Small-Scale Commercial Sales:
-> Perfect for small businesses or individuals selling customized merchandise, like T-shirts or posters, with Flux-generated images.
所以其實就跟官方在文章最前面的 30-second pitch 表達的一樣:
基本上,您可以建立供個人使用的衍生作品,但您不能提供為他人生成圖像的服務——尤其是不收費的服務。
Essentially, you can create derivative works for personal use, but you can't offer a service that generates images for others – especially not for a fee.
✅ 可小規模商用
❌ 不可部署成線上生成服務
不開源
- Flux Pro:敲 API,只有跟 Black Forest Lab 的人合作才能用。
通常我們用 Flux 會把他量化到 4 bits 或 8 bits,
這樣可以在不損失過多圖片品質的情況下讓一般的顯卡順跑,
當然 3GB 的 VRAM 也不是不能跑圖啦只是要等 15 分鐘以上…。
題外話,截至 2024/12 為止,主流的 Stable Diffusion WebUI 也尚未支援 Flux 模型,想嘗鮮的可以到 ComfyUI 跟 Forge 上玩。
- [推薦工具] 讓程式碼截圖變的美美的吧!VScode CodeSnap 與 3 種同功能線上工具介紹 - 2025-01-05
- [AI 繪圖初級教學] 用 X/Y/Z Plot 比較 Stable Diffusion 的 prompt 與 LoRA 效果 - 2024-12-27
- [AI 繪圖中級篇教學] Stable Diffusion WebUI WD14 Tagger 介紹 - 2024-12-26