grok-imagine-videoพูดให้ชัดคือ:
ดังนั้นหลักฐานทางการตอนนี้ไปถึงระดับ “สร้างวิดีโอจาก prompt” แต่ยังไม่ถึงระดับ “เข้าใจวิดีโอที่ผู้ใช้ส่งเข้าไป”
มีแหล่งข้อมูลบุคคลที่สามที่พูดแรงกว่านั้น เช่น บทความที่อ้างว่า Grok สามารถทั้งสร้างวิดีโอและ analyze/watch videos ได้ หน้าเว็บข่าวของ Chatly ที่อ้างว่า Grok 4.3 Beta เพิ่ม video, slides และ speech APIs
บทความ Substack ที่ระบุว่า Grok 4.3 Beta มี native video understanding และ video input
รวมถึงผลค้นหาบน X ที่มีข้อความแนว “Analyze videos”
ข้อมูลเหล่านี้ใช้เป็น “สัญญาณให้ติดตามต่อ” ได้ แต่ยังไม่ใช่หลักฐานระดับเดียวกับเอกสาร API ทางการหรือ release note ทางการของ xAI โดยเฉพาะเมื่อเป็นฟีเจอร์ที่ควรมีรายละเอียดชัดเจน เช่น รูปแบบไฟล์ที่รองรับ ความยาววิดีโอ ขนาดไฟล์ โมเดลที่ใช้ ราคา และขอบเขตการเปิดให้ใช้งาน
การสร้างวิดีโอ คือผู้ใช้ป้อน prompt แล้วโมเดลสร้างคลิปใหม่ออกมา เอกสาร xAI ที่มีอยู่ตอนนี้อยู่ในหมวดนี้ โดยแสดงการเรียก endpoint เพื่อสร้างวิดีโอจากข้อความ
การเข้าใจวิดีโอ เป็นอีกเรื่องหนึ่ง โมเดลต้องรับวิดีโอเป็นอินพุต เข้าใจลำดับเวลา ภาพ บุคคล วัตถุ การเคลื่อนไหว และเหตุการณ์ แล้วตอบคำถามเป็นข้อความ เช่น “ในคลิปนี้เกิดอะไรขึ้น” หรือ “ช่วงท้ายคลิปมีอะไรผิดปกติ”
ถ้าจะยืนยันฟีเจอร์แบบหลัง ปกติควรเห็นเอกสารทางการที่ระบุชัด เช่น รองรับ video input
ถ้าคุณต้องใช้ AI เพื่อสรุปคลิป อธิบายภาพ วิเคราะห์เหตุการณ์ หรือรีวิวฟุตเทจ ควรรอให้ xAI ระบุข้อมูลเหล่านี้อย่างเป็นทางการก่อนจะนับว่า Grok 4.3 รองรับการเข้าใจวิดีโอจริง:
video inputvideo understandinggrok-imagine-video ซึ่งอยู่ในบริบทการสร้างวิดีโอ ถ้าคำถามคือ “ตอนนี้ Grok 4.3 ดูคลิปและอธิบายว่าในวิดีโอเกิดอะไรขึ้นได้หรือยัง” คำตอบตามหลักฐานที่มีคือ: ยังยืนยันไม่ได้อย่างน่าเชื่อถือ
สิ่งที่ยืนยันได้คือ xAI มีเอกสารทางการสำหรับการสร้างวิดีโอ โดยใช้ /v1/videos/generations และ grok-imagine-video ส่วนความสามารถของ Grok 4.3 ในการเข้าใจวิดีโอ วิเคราะห์คลิป หรืออธิบายเหตุการณ์ทีละช่วงนั้น หลักฐานที่มีอยู่ยังมาจากแหล่งบุคคลที่สาม เช่น บทความ เว็บข่าว Substack และผลค้นหาบน X จึงยังไม่ควรถูกนับเป็นการยืนยันอย่างเป็นทางการจาก xAI
Comments
0 comments