生成式動畫 3D 化,Stable Video 3D 登場

今次 Stability AI 推出的新 Model 就是結合在 Stable Video Diffusion 及 Stable Zero 123 的特徵,使用單一張圖片作參考即可生成 3D 動畫。

什麼是SV3D?

Stability AI 宣布發布其最新模型 Stable Video 3D (SV3D),專為渲染 3D 影片而設計。 SV3D 在先前 Stable Video Diffusion 的基礎上引入了新的深度,能夠從單一影像輸入建立和轉換多視圖 3D 視訊。

比 Zero123 生成更理想的 3D 圖片

ComfyUI 文字生成 3D Video

既然官方已開放下載 SV3D,當然要試用一下,利用 ComfyUI 及之前生成 SVD 的配置已經可以生成 sV3D 影片,我就放一個用 Prompts 生成 3D Video 的 workflow 供大家使用。

大家可以先下載 sv3d_p.safetensorssv3d_u.safetensors 以供之後使用。

stabilityai/sv3d at main
We’re on a journey to advance and democratize artificial intelligence through open source and open science.
SV3D workflow

免費下載 workflow

Text to 3D Video for ComfyUI
This is a ComfyUI workflow to generate 3D Video by Text.Using Guide: https://medium.com/gitconnected/transforming-text-into-3d-videos-by-using-comfyui-8c2fe8bb29a6

簡單解釋一下流程

  1. 首先用 SDXL Ligtning/ SDXL Turbo 文字 prompts 快速生成一張圖片。
  2. 使用 sv3d_psv3d_u 出來的結果有明顯分別,但沒有比較好的,選一個用就好了。
  3. 以文字生成的圖片為基礎,生成 3D Video,暫時沒有控制生成結果的展示方式,就是會以物件為中心向左旋轉,官方建議使用 21 格動畫格,生成出來的圖片剛好轉一個圈。
  4. 再用 6 fps 的速度儲存,剛好生成 3.5秒的 3D 動畫。

對兩個模組生成的結果不太滿意,是原圖太複雜嗎?


優化動畫 (1) 增加格數

先不說有點崩壞的樣子,轉一個圈也卡卡的動畫看起來像定格動畫。

我來增加一下影格數到 42 格,fps 增加到 12,試試看會不會變得順暢!?

生成出來的結果可見 42 格會變成轉兩個圈,而不是有雙倍密度的影格填充,而且第二個圈時完全崩壞,所以只有跟隨官方限定的 21 格才能成功。


優化動畫 (2) 插值

ComfyUI 中有一個叫 ComfyUI Frame Interpolation 的 node 可以提升動畫格的流暢度。

  • 在 Save Animated Image 之前加入 GMFSS Fortuna VFI 的 node
  • 這樣可以提升圖片之間的流暢度
在 Save Animated Image 之前
輸出比較流暢的 3D 動畫

就結果今次而言不是太理想,有部份圖形 3D 化效果可能會更好,而且旋轉角度影格數等都不能調整。當然 AI 發展一日千里,在有更新後我會再為大家介紹!