Dynamic Expression (การแสดงออกที่ไดนามิก) — ปรับปรุงการสร้างแบบจำลองการเคลื่อนไหว (motion modeling) และความต่อเนื่องระหว่างเฟรม (temporal coherence) เพื่อแก้ปัญหาการเคลื่อนไหวที่ดูช้าหรือกระตุกในเวอร์ชัน 1.0 ทำให้การเคลื่อนไหวลื่นไหลและมีพลังมากขึ้น
Subject Consistency (ความสม่ำเสมอของตัวละคร/วัตถุ) — รองรับการอ้างอิงรูปภาพสูงสุด 9 รูป พร้อมกัน เพื่อรักษาความคงเส้นคงวาของตัวละคร สินค้า องค์ประกอบแบรนด์ และฉากต่างๆ ระหว่างช็อต (ซึ่งมีความสำคัญอย่างมากสำหรับละครสั้นที่มีหลายตัวละคร การขายของสดออนไลน์ และโฆษณา)
Instruction Following (การทำตามคำแนะนำ) — ความสามารถในการเข้าใจทั้งคำสั่งสั้นๆ และคำบรรยายที่ซับซ้อนดีขึ้น รวมถึงการทำตามคำแนะนำที่ยาวและมีองค์ประกอบหลายอย่าง (long-context instruction following)
Visual Quality (คุณภาพของภาพ) — ปรับปรุงพื้นผิวผิวหนังให้ดูเป็นธรรมชาติมากขึ้นสำหรับมนุษย์ ("naturalized skin textures") ลดปัญหา "หน้ามัน" หรือ "ชาร์ปเกินไป" ที่เคยมีในเวอร์ชันก่อน ทำให้รายละเอียดของผิว สิว รอยย่น ดูสมจริงขึ้น
Native Audio (เสียงในตัว) — ความสามารถด้านเสียง (เสียงพากย์, เสียงประกอบ) ถูกรวมเข้าไปในขั้นตอนการสร้างวิดีโอโดยตรง ทำให้ไม่ต้องแยกสร้างทีหลัง
| โหมด | Input (ปัจจัยนำเข้า) | Output (ผลลัพธ์) |
|---|---|---|
| Text-to-Video (T2V) | ข้อความบรรยาย (Prompt) | วิดีโอ |
| Image-to-Video (I2V) | รูปภาพอ้างอิง 1 รูป + คำสั่ง (ไม่บังคับ) | วิดีโอแอนิเมชันจากรูปภาพ |
| Reference-to-Video (R2V) | รูปภาพอ้างอิง 1–9 รูป + คำสั่ง | วิดีโอที่คงความสม่ำเสมอของตัวละคร/วัตถุ |
| Video Edit | วิดีโอต้นฉบับ + รูปภาพอ้างอิง (ไม่บังคับ สูงสุด 5 รูป) + คำแนะนำ | วิดีโอที่ถูกแก้ไขบางส่วนหรือทั้งหมด |
การคิดราคาของ HappyHorse เป็นแบบจ่ายตามวินาทีของวิดีโอที่สร้างขึ้น (ไม่ใช่ตามเวลาที่ใช้ในการประมวลผล) โดยราคายังคงเท่ากับเวอร์ชัน 1.0 :
Alibaba Cloud Model Studio กำลังเสนอ ส่วนลด 40% สำหรับ 2 สัปดาห์แรก หลังการเปิดตัว ทำให้ราคาเป็นดังนี้ :
Comments
0 comments