Gemini Omni Flash ไม่ใช่แค่โปรแกรมตัดต่อภาพธรรมดา สถาปัตยกรรมหลักของมันเป็นโมเดลที่ใช้พื้นฐาน Transformer ซึ่งสามารถใช้เหตุผลกับข้อมูลนำเข้าที่เป็นข้อความ รูปภาพ เสียง และวิดีโอผสมกัน เพื่อสร้างผลลัพธ์ที่ต่อเนื่องและเป็นหนึ่งเดียว Google ให้เหตุผลว่าสิ่งนี้ทำให้โมเดลมีความฉลาดแบบที่ "เข้าใจโลกความจริง" หมายความว่ามันจะใช้กฎทางฟิสิกส์ พลศาสตร์ ประวัติศาสตร์ และบริบททางวัฒนธรรม เพื่อให้ฉากที่สร้างขึ้นมามีความสมจริง
มันผสานรวมระบบให้เหตุผลของ Gemini เข้ากับโมเดลสื่อสังเคราะห์ที่ได้รับการพิสูจน์แล้วอย่าง Veo, Nano Banana และ Genie ผลลัพธ์คือระบบที่สามารถรับพรอมต์ข้อความ รูปภาพอ้างอิง ตัวอย่างเสียง และคลิปวิดีโอที่มีอยู่แล้วมาพร้อมกัน และถักทอมันให้กลายเป็นคลิปใหม่ความยาว 10 วินาที พร้อมเสียงที่ซิงค์กัน
ทุกวิดีโอที่สร้างโดย Omni Flash จะถูกฝังลายน้ำดิจิทัลที่มองไม่เห็นด้วยเทคโนโลยี SynthID ของ Google เพื่อช่วยในการตรวจสอบที่มาและการระบุคอนเทนต์ที่สร้างโดย AI แม้ว่าข้อจำกัดในตอนนี้จะอยู่ที่ความยาว 10 วินาที แต่ Google ระบุว่านี่คือทางเลือกในการออกแบบสำหรับการเปิดตัวครั้งแรก ไม่ใช่ข้อจำกัดของโมเดล
สิ่งสำคัญที่ควรทราบคือ แม้ว่าคุณจะสร้างวิดีโอที่มีเสียงซิงค์ได้ แต่ตอนนี้โมเดลยังไม่อนุญาตให้คุณแก้ไขเสียงพูดหรือเสียงภายในวิดีโอที่สร้างขึ้นอย่างอิสระ ซึ่งเป็นความสามารถที่ Google จงใจระงับไว้ก่อน
Google เปิดให้ใช้งาน Gemini Omni Flash ทั่วโลกในวันที่ประกาศเปิดตัว โดยกระจายการเข้าถึงผ่านทั้งแบบฟรีและแบบเสียเงิน
สำหรับนักพัฒนาและการเข้าถึง API สำหรับองค์กรยังไม่เปิดให้บริการ Google กล่าวว่าจะทยอยเปิดตัว "ในอีกไม่กี่สัปดาห์ข้างหน้า" ผ่าน Gemini API และ Vertex AI ซึ่งเป็นรูปแบบที่คุ้นเคยสำหรับการเปิดตัวโมเดล Gemini ก่อนหน้านี้
เพียงไม่กี่สัปดาห์หลังการประกาศของ Google ปรัชญาที่ตรงกันข้ามก็ปรากฏขึ้นบนเวที ในงานเปิดตัว Xiaomi 17T Pro ช่วงปลายเดือนพฤษภาคม 2026 ณ กรุงเวียนนา ซึ่งเป็นโทรศัพท์ที่มาพร้อมทั้งกล้องที่ปรับแต่งโดย Leica และความสามารถ Gemini Omni ทาง Leica ได้ประกาศจุดยืนของตนต่อ Generative AI อย่างชัดเจน
ตัวแทนของ Leica คือ Marius Eschweiler รองประธานหน่วยธุรกิจโมบายล์ของ Leica Camera AG ได้กล่าวถึงปรัชญาของบริษัทว่ามุ่งเน้นไปที่การสร้างภาพที่แท้จริงและจำลองความเป็นจริง เขาได้เปรียบเทียบให้เห็นถึงความแตกต่างโดยตรงกับเครื่องมืออย่าง Omni โดยกล่าวว่า "เป็นไปได้สูงที่คุณจะไม่ได้เห็นมันบนกล้อง Leica M" ซึ่งเป็นการตอกย้ำถึงความมุ่งมั่นของแบรนด์ที่มีต่องานฝีมือเชิงทัศนศาสตร์และความบริสุทธิ์ของช่วงเวลาที่ถูกบันทึก
อย่างไรก็ตาม Leica ไม่ได้ปฏิเสธเทคโนโลยีนี้เสียทีเดียว ผู้นำของบริษัทยอมรับว่า Generative AI นั้นสมเหตุสมผลอย่างยิ่งบนสมาร์ทโฟน ในระบบนิเวศที่การถ่ายภาพด้วยการคำนวณ (Computational Photography) เป็นมาตรฐานอยู่แล้ว การสร้างสรรค์และแก้ไขที่ขับเคลื่อนด้วย AI ให้ความรู้สึกเหมือนเป็นวิวัฒนาการตามธรรมชาติของประสบการณ์ผู้ใช้ ไม่ใช่การแตกหักจากประเพณี จุดยืนดังกล่าวสร้างกลยุทธ์คู่ที่ชัดเจน: กล้อง Leica โดยเฉพาะจะยังคงเป็นเครื่องมือของคนที่รักความบริสุทธิ์ในการบันทึกแสง ส่วนโทรศัพท์จะกลายเป็นผืนผ้าใบสำหรับการสร้างสรรค์ที่ใช้ AI ช่วย
Google ได้ส่งสัญญาณอย่างตรงไปตรงมาว่ารุ่น Flash เป็นเพียงก้าวแรก Sundar Pichai ซีอีโอของ Google และ Koray Kavukcuoglu ซีทีโอของ DeepMind ต่างอธิบายว่า Omni คือตระกูลโมเดลที่ถูกออกแบบมาเพื่อ "สร้างอะไรก็ได้จากอะไรก็ได้" ในท้ายที่สุด
หากจะพูดให้ชัดเจนขึ้นในอนาคตอันใกล้ มีสองทิศทางหลัก:
ในระดับที่สูงขึ้น Google มองว่า Omni คือก้าวหนึ่งไปสู่ "โมเดลโลก" เต็มรูปแบบ ซึ่งเป็นระบบที่ไม่ใช่แค่สร้างสื่อ แต่สามารถเข้าใจ จำลอง และโต้ตอบกับสภาพแวดล้อมได้ในทุกโหมด สำหรับตอนนี้ จุดสนใจเร่งด่วนคือการขยายรูปแบบที่ Omni สามารถสร้างได้ และการนำการเข้าถึง API ไปส่งถึงมือนักพัฒนา
Comments
0 comments