簡易版 StableDiffusionWebUI - Fooocus
StableDiffusionWebUI 雖然功能強大,但更多人喜歡 Midjourney 單純用 prompt 的簡易操作方式。StableDiffusionWebUI 最具代表性的 extension - ControlNet 的作者 lllyasviel 重新構思 Stable Diffusion 後推出了這個新軟件 Fooocus。
什麼是 Fooocus?
簡化界面
其用意在於用家可以 Focus 在 prompt 上,不用再花時間去控制幾百種 settings。參考 StableDiffusionWebUI 及 ComfyUI 後得到了啟發,加上 Midjourney 只用 prompt 就可以生成圖片的用法,重新設計了一個只需專注使用 prompt 的 Stable Diffusuion 軟件,其他設定會自動處理好,務求成為一個簡單易用高質的圖片生成軟件。
主界面跟 StableDiffusionWebUI 一樣用 Gradio 建立,但所有的操作就只有 prompt 輸入框及 Generate 按鈕,極為簡潔。
使用更少記憶體
而 Fooocus 另一個特性就是使用極少 VRAM 也可以順利完成 SDXL 的圖片生成,官方表示即使 VRAM 只有 6GB 也能成功。對以前來說即使使用 SD 1.5 生成小圖片也未必足夠的 VRAM 現在可以順利生成 SDXL 大圖片。
這樣強大而簡單的功能,對很多用家來說都是一大福音,是不是馬上就想試試看?
安裝 Fooocus
Windows 版本
- 先從官方 github 下載文件 https://github.com/lllyasviel/Fooocus/releases/download/release/Fooocus_win64_1-1-10.7z
- 解壓後運行
run.bat
就會自動安裝
- 第一次運行時會自動下載
sd_xl_base_1.0_0.9vae.safetensors
及sd_xl_refiner_1.0_0.9vae.safetensors
,每個檔案都超過 6GB,要花點時間下載。
Mac / Linux 版本
事前可以參考安裝 StableDiffusionWebUI 安裝 Python 的方法,如已安裝 Python 可以跳過。
- 先用 git 下載文件到資料夾 Fooocus
git clone https://github.com/lllyasviel/Fooocus.git
- 然後設定 venv
python venv ./venv
- 啟動 venv
python activate ./venv/bin/activate
- 最後安裝所需 python 軟件
pip install -r requirment_versions.txt
- 安裝完成後用
python launch.py
來運行。 - 第一次運行時會自動下載
sd_xl_base_1.0_0.9vae.safetensors
及sd_xl_refiner_1.0_0.9vae.safetensors
,每個檔案都超過 6GB,要花點時間下載。
基本用法
很簡單的就是在 Prompt 輸入框輸入 prompt 再按 Generate 就可以。預設每次會生成兩張 1152 x 896
電影風格的圖片。
進階設定
相信大家馬上就發現在 prompt 輸入框下面有個 Advanced 按鈕,按下就可以進行進階設定。
Setting
有幾個簡單的設定:
- Performance 效能 - 預設 Speed 生成時用
30
個 step,Quality 會比較久但使用60
個 step。 - Aspect Ratios 長闊比 - 預設
1152 x 896
,選你想要的大小就好了。 - Image Number 生成張數 - 預設為
2
,每次生成多少張,最多32
張。 - Random Seed - 預設為
-1
就是隨機,可以輸入你想用的 Seed number。 - Negative Prompt - 反向 Prompt
Style
這頁就是生成圖片風格,預設使用 cinematic-default
風格。有超過 100 款風格以供選擇,雖然從字面大概可以猜到是什麼風格,但沒有範例圖片參考總難以比較,所以我以 1girl
為 prompt,每個風格生成了一張 1024 x 1024
的圖片以供參考。(比寫整篇 blog 花多十倍時間,連官方都還沒有風格參考圖)
Advanced
Advanced 這頁主要是設定 Model 用。
- SDXL Base Model - 預設是自動下載
sd_xl_base_1.0_0.9vae
。 - SDXL Refiner - 預設是自動下載
sd_xl_refiner_1.0_0.9vae
。 - LoRAs - 最多可以同時選 5 個 LoRA 及其權重,預設使用的
sd_xl_offset_example
會使生成效果比沒有用好一點。
總結
雖然還在開發初期,但 Fooocus 已經為我帶來極大的驚喜,其簡單的操作及對節省資源的幫助都對使用者十分友善,為一直以來入門難度極高的 Stable Diffusion 的 UX 提升了不少,希望 Fooocus 可以續繼發展為一個功能強大兼操作簡單的軟件,令更多人可以更簡單地進行 AI Art 創作。