What did Google announce with Gemini Omni at I/O 2026, how does it differ from Veo, what can Gemini Omni Flash do with text, image, audio, aGemini Omni is Google’s new multimodal AI model designed to generate video from combined text, image, audio, and video inputs.
AI พรอมต์
Create a landscape editorial hero image for this Studio Global article: What did Google announce with Gemini Omni at I/O 2026, how does it differ from Veo, what can Gemini Omni Flash do with text, image, audio, a. Article summary: Google announced Gemini Omni at I/O 2026 as a new multimodal generation model that combines Gemini reasoning with creative generation, starting with video: it can take text, images, audio, and video together as input and. Topic tags: general, general web, user generated. Reference image context from search candidates: Reference image 1: visual subject "# Google's Gemini Omni can generate 'anything from any input,' starting with video. Google didn't forget AI creators in its latest round of Gemini announcements. Google didn't forg" source context "Google's Gemini Omni Can Generate 'Anything From Any Input ..." Reference image 2: visual subject "# Gemini Omni Vid
openai.com
Gemini Omni คืออะไร
ในงาน Google I/O 2026 Google เปิดตัว Gemini Omni ซึ่งเป็นตระกูลโมเดล AI แบบมัลติโหมด (multimodal) รุ่นใหม่ที่ออกแบบมาเพื่อสร้างสื่อจากอินพุตหลายรูปแบบพร้อมกัน เช่น ข้อความ ภาพ เสียง และวิดีโอ
Googleอธิบายว่า Omni คือจุดที่ ความสามารถด้านการให้เหตุผลของ Gemini มาบรรจบกับการสร้างสื่อด้วย AI ทำให้ผู้ใช้สามารถสร้างวิดีโอคุณภาพสูงจากอินพุตหลายประเภทในคำสั่งเดียวได้
คำตอบสั้น ๆ สำหรับ "Gemini Omni: โมเดล AI แบบมัลติโหมดของ Google ที่สร้างวิดีโอจากข้อความ ภาพ เสียง และวิดีโอได้" คืออะไร
Google เปิดตัว Gemini Omni ในงาน I/O 2026 เป็นโมเดล AI แบบมัลติโหมดที่สร้างวิดีโอคุณภาพสูงจากข้อความ ภาพ เสียง และวิดีโอ โดยรุ่นแรกคือ Gemini Omni Flash ที่เริ่มทยอยเปิดใช้งานทันที[8][9]
ประเด็นสำคัญที่ต้องตรวจสอบก่อนคืออะไร?
Google เปิดตัว Gemini Omni ในงาน I/O 2026 เป็นโมเดล AI แบบมัลติโหมดที่สร้างวิดีโอคุณภาพสูงจากข้อความ ภาพ เสียง และวิดีโอ โดยรุ่นแรกคือ Gemini Omni Flash ที่เริ่มทยอยเปิดใช้งานทันที[8][9] ต่างจาก Veo ที่เป็นโมเดลวิดีโอโดยเฉพาะ Gemini Omni รวมความสามารถด้านเหตุผลของ Gemini และการสร้างสื่อไว้ในโมเดลเดียว รองรับอินพุตหลายรูปแบบพร้อมกัน[20][23]
ฉันควรทำอย่างไรต่อไปในทางปฏิบัติ?
Google เปิดตัวระบบโปร่งใสของเนื้อหาอย่าง SynthID เพื่อฝังลายน้ำในคอนเทนต์ AI และขยายการตรวจจับไปยัง Google Search, Chrome และพันธมิตรอย่าง OpenAI, Kakao, ElevenLabs และ Nvidia[24][39]
ในงานเดียวกัน Google ยังเปิดตัวแพ็กเกจ AI Ultra ราคา 100 ดอลลาร์ต่อเดือน ซึ่งออกแบบมาสำหรับนักพัฒนาและครีเอเตอร์ที่ต้องการพลังประมวลผลสูงในระบบ Gemini
SynthID: ลายน้ำและระบบตรวจจับคอนเทนต์ AI
พร้อมกับการเปิดตัวเครื่องมือสร้างสื่อใหม่ Google ยังเน้นเรื่อง ความโปร่งใสของคอนเทนต์ AI ผ่านระบบ SynthID
SynthID เป็นเทคโนโลยีลายน้ำดิจิทัลแบบมองไม่เห็น ซึ่งฝังสัญญาณไว้ในคอนเทนต์ที่สร้างด้วย AI เช่น
ภาพ
วิดีโอ
เสียง
ข้อความ
ลายน้ำเหล่านี้ มนุษย์มองไม่เห็น แต่ซอฟต์แวร์สามารถตรวจจับได้ เพื่อช่วยยืนยันว่าคอนเทนต์ถูกสร้างด้วย AI หรือไม่
ในงาน I/O 2026 Google ประกาศขยายการใช้งาน SynthID หลายด้าน
การตรวจจับในผลิตภัณฑ์ของ Google
Google กำลังเพิ่มเครื่องมือตรวจสอบใน Google Search และ Chrome เพื่อช่วยให้ผู้ใช้สามารถดูได้ว่า ภาพที่พบออนไลน์เป็นภาพจริง ภาพที่ถูกแก้ไข หรือภาพที่สร้างด้วย AI
การยอมรับจากบริษัทอื่น
Google ยังประกาศว่าบริษัทหลายแห่งเริ่มนำ SynthID ไปใช้ในระบบ AI ของตัวเอง เช่น
OpenAI
Kakao
ElevenLabs
Nvidia
เป้าหมายคือการสร้าง มาตรฐานร่วมของอุตสาหกรรม สำหรับการระบุคอนเทนต์ที่สร้างด้วย AI บนอินเทอร์เน็ต
การเปิดตัว Gemini Omni สะท้อนแนวโน้มใหม่ของโมเดล AI
แทนที่จะมีโมเดลแยกกันสำหรับข้อความ ภาพ หรือวิดีโอ Google กำลังมุ่งสู่ ระบบ AI แบบมัลติโหมดที่รวมทุกอย่างไว้ในโมเดลเดียว
ขั้นแรกคือการสร้างวิดีโอจากอินพุตหลายรูปแบบ แต่เป้าหมายระยะยาวคือโมเดลที่สามารถ สร้างเอาต์พุตใดก็ได้จากอินพุตใดก็ได้ ซึ่งเป็นแนวทางที่ Google มองว่าเป็นก้าวสำคัญของ AI ด้านการเข้าใจโลกและการสร้างสื่อดิจิทัล
ในขณะเดียวกัน Google ก็พยายามพัฒนาระบบตรวจสอบและลายน้ำอย่าง SynthID ควบคู่ไปด้วย เพื่อลดความเสี่ยงจากคอนเทนต์ AI และดีปเฟกในโลกออนไลน์
newsbytesapp.comGoogle unveils Gemini 3.5 Flash, Omni, and Spark AI
Comments
0 comments