Wan2.2-S2V Avatar - image + audio -> talking video (lip-sync) - ZeroGPU H200

ใส่ภาพหน้าตรง + ไฟล์เสียงพูด -> วิดีโอคนพูดขยับปากตามเสียง (รองรับหลายภาษา)

ความละเอียด (720p ช้ากว่า)
8 50
1 8