นอกเหนือจากความเร็วแล้ว Grok Imagine Video 1.5 ยังจัดการกับสิ่งผิดปกติทางสายตาที่เป็นปัญหาเรื้อรังของโมเดลวิดีโอ AI รุ่นก่อนๆ มักจะประสบปัญหาความต่อเนื่องของการเคลื่อนไหว ทำให้เกิดคลิปที่มีการบิดเบี้ยวของแขนขาอย่างไม่เป็นธรรมชาติ และวัตถุที่ "ลอย" ซึ่งเผยให้เห็นถึงแหล่งกำเนิดจากการสังเคราะห์ โมเดลเวอร์ชัน 1.5 แก้ไขพฤติกรรมเหล่านี้ได้อย่างมีนัยสำคัญ ให้การเคลื่อนไหวของตัวละครและกล้องที่นุ่มนวลและเป็นธรรมชาติยิ่งขึ้น
ที่ลึกซึ้งยิ่งกว่านั้นคือ โมเดลนี้สามารถจำลองฟิสิกส์ในโลกแห่งความเป็นจริงได้อย่างแนบเนียนยิ่งขึ้น แสดงให้เห็นถึงความเข้าใจที่ดีขึ้นเกี่ยวกับน้ำหนักและโมเมนตัม ฉากต่างๆ สามารถแสดงให้เห็นถึงคนเดินโดยที่เสื้อผ้าพลิ้วไหวอย่างเป็นธรรมชาติ หรือวัตถุที่ตกลงมาด้วยเส้นทางการเร่งความเร็วที่สมจริง ส่งผลให้วิดีโอที่ได้ให้ความรู้สึกราวกับมีตัวตนทางกายภาพมากกว่าที่จะเป็นการประกอบขึ้นแบบดิจิทัล
การเพิ่มเติมที่สำคัญที่สุดในเชิงกลยุทธ์คือการมาของ ระบบสร้างเสียงที่ซิงค์ในตัว ซึ่งเป็นฟีเจอร์ที่ไม่เคยมีอยู่ในเวอร์ชันก่อนหน้านี้เลย ในอดีต การเพิ่มเสียงลงในคลิปที่สร้างจาก Grok ต้องใช้เครื่องมือภายนอกและการซิงค์ด้วยมือ แต่เวอร์ชัน 1.5 นี้สามารถสร้างวิดีโอพร้อมเสียงที่ล็อคเข้ากับการแสดงผลบนหน้าจอโดยอัตโนมัติ ไม่ว่าจะเป็นเสียงสิ่งแวดล้อม เอฟเฟกต์เสียง และบรรยากาศ จะถูกสร้างไปพร้อมๆ กับภาพ
การทำเช่นนี้ช่วยขจัดจุดเสียดทานสำคัญในกระบวนการสร้างสรรค์ ทำให้ศิลปินและนักสร้างคอนเทนต์สามารถผลิตสื่อโสตทัศน์ที่สมบูรณ์ได้ในขั้นตอนเดียว
การเปิดตัวครั้งนี้เกิดขึ้นหลังจากช่วงพรีวิวที่ประสบความสำเร็จอย่างสูงซึ่งเริ่มขึ้นในวันที่ 3 มิถุนายน 2026 ในช่วงเวลานี้ Grok Imagine Video 1.5 ได้แสดงให้เห็นถึงความเหนือกว่าอย่างรวดเร็วบนมาตรวัดอุตสาหกรรม โดยไต่ขึ้นไปอยู่อันดับหนึ่งบน Artificial Analysis Video Arena ด้วยคะแนนที่เพิ่มขึ้นอย่างโดดเด่นถึง +52 Elo จากโมเดล 1.0 รุ่นเก่า
มันสามารถเอาชนะคู่แข่งรายสำคัญอย่าง Seedance 2.0 ของ ByteDance และ Veo ของ Google ซึ่งเป็นความสำเร็จที่ซีอีโอ อีลอน มัสก์ นำมาโปรโมทด้วยการแชร์ตัวอย่างหนังที่สร้างโดย AI สำหรับเรื่อง The Iliad ซึ่งมียอดชมทะลุ 18 ล้านครั้งบนแพลตฟอร์ม X
Grok Imagine Video 1.5 แตกต่างจากแชทบอท Grok แม้ว่าจะใช้แบรนด์ร่วมกันก็ตาม มันคือโมเดลเฉพาะสำหรับการแปลงทั้งข้อความและรูปภาพให้เป็นวิดีโอ เมื่อช่วงพรีวิวสิ้นสุดลงแล้ว ตอนนี้มันพร้อมให้ใช้งานสำหรับนักพัฒนาผ่าน xAI API ภายใต้ชื่อโมเดล
grok-imagine-video-1.5 และสำหรับผู้ใช้ทั่วไปผ่านแอป Grok Imagine บนเว็บ, iOS และ Android การพับฟีเจอร์เสียงซิงค์เข้าไปในกระบวนการสร้างสรรค์ที่รวดเร็วโดยตรงของ xAI คือการเดิมพันว่าประสบการณ์การสร้างสรรค์แบบครบวงจรในที่เดียว จะเป็นตัวกำหนดทิศทางของสมรภูมิการแข่งขัน AI สร้างวิดีโอในเฟสต่อไป
Comments
0 comments