Prompts 中的 score_9 有什麼意思?
大家應該在不少 C 站的作品中見到 score_9, score_8_up, score_7_up, score_6_up, score_5_up, score_4_up ,這種意義不明,複製了又好像沒有什麼作用的 prompts,到底這些 score 有什麼作用?讓我們深入探討一下。
大家應該在不少 C 站的作品中見到 score_9, score_8_up, score_7_up, score_6_up, score_5_up, score_4_up
,這種意義不明,複製了又好像沒有什麼作用的 prompts,到底這些 score 有什麼作用?讓我們深入探討一下。
用這些 prompts 的 Model 是什麼?
如果依照 prompts 的 Checkpoint Model 追查下去,就會發現都是基於一個 Model 分類為 Pony,就是 My Little Pony 那個 Pony,為什麼要有一種叫 Pony 的 Checkpoint Model 呢?是因為站長很喜歡 My Little Pony 嗎?
什麼是 Pony Diffusion?
一切基於 Pony Diffusion 這個 Model,就是一個 My Little Pony 愛好者,用很多 Pony 作為 Dataset 來訓練的 Model 吧?那麼這個 Model 有什麼特別,需要開一個分類來區分呢?
這是一個動畫風的 Model,也有一些人 fine tune 成寫實風格或 2.5D 風格,但基礎 Model 都是動畫風的。這個 Model 的作者實現了一個創新的評級方法,就是 score。
Pony Diffusion 有什麼特別?
他在訓練前,利用多個月的時間來訓練電腦區分 “好” 跟 “不好” 的圖片,令電腦懂得什麼是美學。為了準確地為每一張圖評分,作者在 Pony Diffusion V6 版本中人手標籤了 20000 張圖片!
這些已標籤的 Dataset 就是 Pony Diffusion 最有價值的地方,因為他不只用一堆 My Little Pony 的圖片去訓練,還忠實地為他們評分。
在訓練時加入了 score_9, score_8_up, score_7_up, score_6_up, score_5_up, score_4_up
這類 tag 使標籤,令人生成圖片時只要加入 score_8_up
就會生成 8 分以上的圖片,使用 score_9
就會生成最優質的圖片。
使用這樣的 prompts e.g. score_9, a cute little pony
就會生成一隻最最最可愛的 Pony,而使用 score_8_up, a cute little pony
就會生成一隻比較沒這麼可愛的 Pony。
這種明確清楚的評分制度,遠比加入一堆 masterpiece, best quality, high resolution
更易控制及容易理解,這就是 Pony Diffusion 受觀迎的最大原因。
圖片比較
現在最新版的 Pony Diffusion 是 V6 XL,聽說 V7 放棄使用 Stable Diffusion 3 來訓練,看來暫時不會有新版本出來。
注意 Pony Diffusion V6 XL 的 Bug !
Pony Diffusion V6 XL 由於 Dataset 設定上的錯誤,所以用 score tag 的使用有以下限制:
- 使用
score_8_up
原本是包含了score_9
,但應該是忘了在score_9
的圖片加上score_8_up
等 tag,所以使用score_8_up
時,需要將以上的 tag 都加上, e.g. 使用score_7_up
時需要加上score_9, score_8_up
。 - 由於時間及資源不足,所以最低分的只有
score_4_up
,並沒有完全訓練到可以使用score_1, score_2, score_3
。 - 相信 V7 會 fix 以上的問題。
比較一下不同 Score 下生成的圖片
{score}, pony, {pony name}, forest
以不同的分數設定中看到了生成圖片的分別,雖然部份原因也可能包括了 Pony Diffusion 作者的個人喜好,但整體上做用 score system 是更準確地生成高水準 (或者低水準),而不用 masterpiece
等 prompts。
有些人認為此系統而應該在所有 Model 中使用,以確保生成圖片的質素是可控制的。