Stable Diffusion

Fooocus 再度進化，新模式新功能

現在幾乎是我最喜歡的 Stable Diffusion 軟件，剛剛更新到最新版本 2.1.824 還沒有到 2.2 但已經加入很多強大的功能，並一直與 Midjourney 看齊。

Edmond Yip

Dec 5, 2023 — 9 min read

現在幾乎是我最喜歡的 Stable Diffusion 軟件，剛剛更新到最新版本 2.1.824 還沒有到 2.2 但已經加入很多強大的功能，並一直與 Midjourney 看齊。

更新程式

先使用指令 git pull 取得最新版本。
使用指令 python entry_with_update.py 啟動同時進行更新。

Newer models and configs are available. Download and update files? [Y/n]

系統會問你是否更新及下載再新 Model。按 Y 確定就會開始更新更下載新 Model。
這次更新會預設下載 Juggrnaut XL v6 取代原生 SDXL v1 Model 以取得更好效果，此 Model 生成歐美真人相當有真實感，值得推薦使用。
由 Fooocus v2.1.60 開始支援不同的啟動模式。
如果目標是生成動漫人物的話，可以使用 python entry_with_update.py --preset anime 作為啟動指令，Windows 用戶可以用 run_anime.bat 啟動程式，那麼預設下載的 Model 會改為 blue Pencil XL 。並會下載 DreamShaper v8 作為 refiner model 及 unaesthetic XL v3.1 為其 embeddings，原來可以用 1.5 Model 來作 refiner 使用。
既然有生成動漫人物專用的指令，當然也提供了生成真實人物的指令，使用 python entry_with_update.py --preset realistic 作為啟動指令，Windows 用戶可以以用 run_realistic.bat 啟動程式，就會下載 Realistic Stock Photo v1 作為 Model，名符其實此款 Model 可生成貌似 Stock Photo 的相片。另外還會下載 SDXL Film Photography Style 作 LoRA 取代 SDXL Offset 並會用直倒 896 x 1152 生成圖片。

測試三個模式

把東西都下載好後，接下來就試試看預設模式下三個設定生成出來的圖片有什麼分別！ Prompt 為 1girl 及 ginger cat 。

預設模式

Performance 為 Speed，長闊大預為 1152 x 896 。
Style 同時使用了 Fooocus V2, Fooocus Enhance , Fooocus Sharp 。
Base Mode 使用 Juggernaut XL v6 ，沒有使用 refiner。
LoRA 使用了 SDXL Offset。
Guidance Scale 設定為 4 ，Image Sharpness 設定為 2 。

1girl 出來多數是歐美女性的樣子，真實感高，色調偏黃，有專業攝影的感覺。

ginger cat 真貓一樣，貓毛偏長(?)，環境光還是偏黃，對比高很高，毛髮精細度也很高！

寫實模式預設設定

Performance 為 Speed，長闊大預為 896 x 1152 。
Style 同時使用了 Fooocus V2 , Fooocus Photograph , Fooocus Negative 。
Base Model 使用了 Realistic Stock Photo v1 ，沒有使用 Refiner。
LoRA 使用了 SDXL Film Photography Style 。
Guidance Scale 設定為 3 ，Image Sharpness 設定為 2 。

1girl 出來有日系女孩的樣子，色調偏藍有用菲林相機拍照的感覺。

ginger cat 還是很可愛的貓貓，景深相當強，色調較柔和，對比度也比較低。

動漫模式預設設定

Performance 為 Speed，長闊大預為 896 x 1152 。
Negative Prompt 中使用了 unaesthetic XL v3.1 。
Base Model 使用了 bluePencil XL v5 。
Refiner Model 使用了 DreamShaper v8 。
LoRA 使用了 SDXL offset 。
Style 同時使用了 Fooocus V2, Fooocus Masterpiece, SAI Anime, SAI Digital Art, SAI Enhance, SAI Fantasy Art。
Guidance Scale 為 7 ，Image Sharpness 為 2 。

1girl 都有些中國風的建築背景，人物的服飾也有些中國元素，色調柔和有些平塗的感覺。

ginger cat 長毛風格的貓貓，顏色亮麗畫風也很平易近人。

極速模式

在最近 LCM 及 SDXL Turbo 推動高速化生成，Fooocus 當然也有提供極速模式，在 Performance 選取 Extreme Speed 模式，開始生成前會自動下載 SDXL LCM LoRA，同時會鎖定了 Advanced 中的 Guidance Scale 及 Image Sharpness 設定。同時生成步數會大幅減少至 8 。

以下是預設模式 Extreme Speed 下生成的圖片：

雖然解像度明顯下解了不少，但整體上的成果還是比 Stable Diffusion WebUI ＋LCM 優秀，相信 Fooocus V2 的 prompt 幫上了不少忙，速度上即使沒有快至 1 秒完成，但也比 Speed Mode 快上幾倍，對電腦比較慢的用家有很大幫助！

Fooocus Styles

之前的 Default (Slightly Cinematic) 改成 Fooocus Cinematic。
新增 Fooocus Sharp 來改善 SDXL 的模糊及增加銳利度。
新增 Fooocus Enhance 來自 Juggernaut XL 預設的 negative prompts 來改善圖片的質素。
將原本預設的 Default (Slightly Cinematic) 改成 Fooocus Sharp, Fooocus Enhance 及 Fooocus V2 。
現在選取了的 Style 會排到最高。

Image Prompt

就像 Stable Diffusion 使用 IP-Adapter 一樣可以跟據輸入的圖片去生成圖片，不過一些生圖的原則就有點不一樣，反而跟 Midjourney 的 Image Prompt 相似。

以下圖表比較三者的分別：

	Midjourney	Ip-Adapter	Fooocus
文字Prompt	與圖片 Prompt 混合	多數會無視文字 Prompt	與圖片 Prompt 混合
使用多張圖片	維持畫質	畫質下降	維持畫質
單圖輸入失敗	輸出無關連但維持高畫質的圖片	輸出有關連但低畫質的圖片	輸出無關連但維持高畫質的圖片
多圖輸入失敗	無視無效的圖片維持高畫質的圖片	輸出有關連但低畫質的圖片	無視無效的圖片維持高畫質的圖片
畫質影響	輸入圖片對畫質無影響	輸入低質圖片會影響輸出圖片畫質	輸入圖片對畫質幾乎無影響
結果變化	輸入圖片後仍然有變化	變化較少	輸入圖片後仍然有變化