簡易版 StableDiffusionWebUI

StableDiffusionWebUI 雖然功能強大，但更多人喜歡 Midjourney 單純用 prompt 的簡易操作方式。StableDiffusionWebUI 最具代表性的 extension - ControlNet 的作者 lllyasviel 重新構思 Stable Diffusion 後推出了這個新軟件 Fooocus。

什麼是 Fooocus？

簡化界面

其用意在於用家可以 Focus 在 prompt 上，不用再花時間去控制幾百種 settings。參考 StableDiffusionWebUI 及 ComfyUI 後得到了啟發，加上 Midjourney 只用 prompt 就可以生成圖片的用法，重新設計了一個只需專注使用 prompt 的 Stable Diffusuion 軟件，其他設定會自動處理好，務求成為一個簡單易用高質的圖片生成軟件。

主界面跟 StableDiffusionWebUI 一樣用 Gradio 建立，但所有的操作就只有 prompt 輸入框及 Generate 按鈕，極為簡潔。

簡易界面

使用更少記憶體

而 Fooocus 另一個特性就是使用極少 VRAM 也可以順利完成 SDXL 的圖片生成，官方表示即使 VRAM 只有 6GB 也能成功。對以前來說即使使用 SD 1.5 生成小圖片也未必足夠的 VRAM 現在可以順利生成 SDXL 大圖片。

這樣強大而簡單的功能，對很多用家來說都是一大福音，是不是馬上就想試試看？

安裝 Fooocus

GitHub - lllyasviel/Fooocus: Focus on prompting and generating

Focus on prompting and generating. Contribute to lllyasviel/Fooocus development by creating an account on GitHub.

GitHublllyasviel

官方 Github

Windows 版本

先從官方 github 下載文件 https://github.com/lllyasviel/Fooocus/releases/download/release/Fooocus_win64_1-1-10.7z
解壓後運行 run.bat 就會自動安裝

第一次運行時會自動下載 sd_xl_base_1.0_0.9vae.safetensors 及 sd_xl_refiner_1.0_0.9vae.safetensors，每個檔案都超過 6GB，要花點時間下載。

Mac / Linux 版本

事前可以參考安裝 StableDiffusionWebUI 安裝 Python 的方法，如已安裝 Python 可以跳過。

MacOS 安裝 StableDiffusionWebUI 及有用的 Extension

雖然網上有不少 Cloud 的圖像生成 AI service，但是如果要大量/長期免費地使用，在本地安裝及依靠本機運算能力的 Stable Diffusion 是一個不錯的選擇。

從不停下來的學習Edmond Yip

先用 git 下載文件到資料夾 Fooocus git clone https://github.com/lllyasviel/Fooocus.git
然後設定 venv python venv ./venv
啟動 venv python activate ./venv/bin/activate
最後安裝所需 python 軟件 pip install -r requirment_versions.txt
安裝完成後用 python launch.py 來運行。
第一次運行時會自動下載 sd_xl_base_1.0_0.9vae.safetensors 及 sd_xl_refiner_1.0_0.9vae.safetensors，每個檔案都超過 6GB，要花點時間下載。

基本用法

很簡單的就是在 Prompt 輸入框輸入 prompt 再按 Generate 就可以。預設每次會生成兩張 1152 x 896 電影風格的圖片。

進階設定

相信大家馬上就發現在 prompt 輸入框下面有個 Advanced 按鈕，按下就可以進行進階設定。

Setting

Fooocus Setting

有幾個簡單的設定：

Performance 效能 - 預設 Speed 生成時用 30 個 step，Quality 會比較久但使用 60 個 step。
Aspect Ratios 長闊比 - 預設 1152 x 896，選你想要的大小就好了。
Image Number 生成張數 - 預設為 2，每次生成多少張，最多 32 張。
Random Seed - 預設為 -1 就是隨機，可以輸入你想用的 Seed number。
Negative Prompt - 反向 Prompt

Style

Fooocus Style

這頁就是生成圖片風格，預設使用 cinematic-default 風格。有超過 100 款風格以供選擇，雖然從字面大概可以猜到是什麼風格，但沒有範例圖片參考總難以比較，所以我以 1girl 為 prompt，每個風格生成了一張 1024 x 1024 的圖片以供參考。(比寫整篇 blog 花多十倍時間，連官方都還沒有風格參考圖)

none, cinematic-default, sai-3d-model, sai-analog flim, sai-anime

sai-cinematic, sai-comic book, sai-craft clay, sai-digital art, sai-enchance

sai-fantasy art, sai-isometric, sai-line art, sai-lowpoly, sai-neopunk

sai-origami, sai-photographic, sai-pixel art, sai-texture, ads-advertising

ads-automotive, ads-corporate, ads-fashion editorial, ads-food photography, ads-luxury

ads-real estate, ads-retail, artstyle-abstract, artstyle-abstract expressionism, artstyle-art deco

artstyle-art nouveau, artstyle-constructivist, artstyle-cubist, artstyle-expressionist, artstyle-grafffiti

artstyle-hyperrealism, artstyle-impressionist, artstyle-pointillism, artstyle-pop art, artstyle-psychedelic

artstyle-renaissance, artstyle-steampunk, artstyle-surrealist, artstyle- typography, artstyle-watercolor

futuristic-biomechanical, futuristic-cybernetic, futuristic-boimerchanical cyberpunk, futuristic-chybernetic, futuristic-cybernetic robot

futuristic-cyberpunk cityscape, futuristic-futuristic, futuristic-retro cyberpunk, futuristic-retro futrurism, futristic-sci-fi

futuristic-vaporwave, game-bubble bobble, game-cyberpink game, game-fighting game, game-gta

game-mario, game-minecraft, game-pokemon, game-retro arcade, game-retro game

game-rpg fantasy game, game-strategy game, game-streetfighter, game-zelda, mis-architectural

misc-disco, misc-dreamscape, misc-dystopian, misc-fairy tale, misc-gothic

misc-grunge, misc-horror, misc-kawaii, misc-lovecraftian, misc-macabre

misc-mange, misc-metropolis, misc-minimalist, misc-monochrome, misc-nautical

misc-space, misc-stained glass, misc-techwear fashion, misc-tribal, misc-zentangle

papercraft-collage, papercraft-flat papercut, papercraft-kirigami, papercraft-paper mache, papertcraft-paper quilling

papercraft-papercut collage, papercraft-papercut shadow box, papercraft-stacked papercut, papercraft-thick layered papercut, photo-alien

photo-flim noir, photo-hdr, photo-long exposure, futuristic-retro futurism, futuristic-sci-fi

photo-tilt-shift

Advanced

Fooocus Advanced

Advanced 這頁主要是設定 Model 用。

SDXL Base Model - 預設是自動下載 sd_xl_base_1.0_0.9vae 。
SDXL Refiner - 預設是自動下載 sd_xl_refiner_1.0_0.9vae 。
LoRAs - 最多可以同時選 5 個 LoRA 及其權重，預設使用的 sd_xl_offset_example 會使生成效果比沒有用好一點。

總結

雖然還在開發初期，但 Fooocus 已經為我帶來極大的驚喜，其簡單的操作及對節省資源的幫助都對使用者十分友善，為一直以來入門難度極高的 Stable Diffusion 的 UX 提升了不少，希望 Fooocus 可以續繼發展為一個功能強大兼操作簡單的軟件，令更多人可以更簡單地進行 AI Art 創作。