ปัจจุบันแอปพลิเคชันนี้พร้อมให้ใช้งานบน macOS, iOS, และ Android แล้ว แต่เวอร์ชัน macOS นั้นได้นำกลยุทธ์ที่น่าสนใจในการคัดเลือกโมเดลมาใช้ แตกต่างจากไลบรารีแบบเปิดของ Ollama และ LM Studio ที่ให้ผู้ใช้สามารถดึงโมเดลที่เข้ากันได้เกือบทุกรูปแบบมาใช้งาน มาในขณะที่ AI Edge Gallery บน macOS นั้นเปิดให้ใช้ โมเดล Gemma จำนวน 5 ตัวที่ Google คัดสรรมาแล้วเท่านั้น
โดย 9to5Mac รายงานว่า โมเดลที่มีให้เลือกใช้ ได้แก่ Gemma-4-12B-it, Gemma-4-E2B-it, Gemma-4-E4B-it, Gemma-4 รุ่น 26B, และ FunctionGemma-270M
การเลือกด้วยมือนี้คือหัวใจของกลยุทธ์ของ Google: สภาพแวดล้อมที่ควบคุมและรับรองคุณภาพ
เบื้องหลังการทำงานของระบบนิเวศนี้ ขับเคลื่อนโดยเครื่องอนุมาน LiteRT-LM ของ Google ซึ่งรองรับหน่วยประมวลผลทั้ง CPU, GPU, และ NPU บน Linux, macOS, และ Windows โมเดลเด่นที่ถูกใช้สำหรับการวัดประสิทธิภาพคือ Gemma-4-E2B (ขนาด 2.58 GB) และเอกสารอย่างเป็นทางการได้แสดงให้เห็นถึงความสามารถบน MacBook Pro M4 อย่างชัดเจน
:
ความเร็วที่เพิ่มขึ้นอย่างก้าวกระโดดเมื่อใช้การเร่งด้วย GPU นี้ แสดงให้เห็นว่าสแต็กของ Google ได้รับการปรับแต่งมาสำหรับ Metal API ของ Apple Silicon ได้ดีเพียงใด มอบประสบการณ์การใช้งานที่เกือบจะทันทีทันใดและลื่นไหล
Gemma 4 12B ที่เปิดตัวภายใต้ลิขสิทธิ์ Apache 2.0 คือดาราตัวจริงของการเปิดตัวครั้งนี้ สถาปัตยกรรมของมันคือตัวสร้างความแตกต่างที่ใหญ่ที่สุด มันคือ หม้อแปลงชนิด Dense, Decoder-only ที่ใช้โครงสร้างตัวถอดรหัสขั้นสูงแบบเดียวกับโมเดล Gemma 4 31B Dense ที่ใหญ่กว่ามาก
นวัตกรรมที่สำคัญคือการออกแบบที่ ไร้ตัวเข้ารหัส สำหรับมัลติโหมด โมเดลมัลติโหมดส่วนใหญ่ใช้ตัวเข้ารหัสที่ซับซ้อนแยกต่างหากสำหรับการมองเห็น (เช่น ViT) และเสียง (เช่น conformer layers) เพื่อแปลงข้อมูลให้กับโมเดลภาษา แต่ Gemma 4 12B ได้กำจัดมันออกไปทั้งหมด
โดยใช้:
สิ่งนี้ทำให้โมเดลสามารถประมวลผล ข้อความ รูปภาพ เสียง และวิดีโอ ในกระแสข้อมูลเดียวที่เป็นหนึ่งเดียวกันได้โดยตรง Google อ้างว่าสถาปัตยกรรมนี้ให้ "ประสิทธิภาพที่ใกล้เคียงกับโมเดล 26B MoE ของเรา แต่ใช้หน่วยความจำน้อยกว่าครึ่งหนึ่ง" ทั้งหมดนี้ทำงานบนโน้ตบุ๊กผู้บริโภคที่มี แรมยูนิฟายด์แค่ 16 GB
ผลการทดสอบมาตรฐาน (Benchmarks) ยืนยันความมั่นใจนี้ โดยแสดงให้เห็นว่าโมเดล 12B มีศักยภาพสูงกว่าระดับน้ำหนักของมันมาก ในการทดสอบ GPQA Diamond (การให้เหตุผลระดับปริญญาโท-เอก) มันทำคะแนนได้น่าประทับใจที่ 78.8 ใกล้เคียงกับรุ่น 26B สำหรับการทดสอบแบบเลือกตอบสไตล์วิชาการอย่าง MMLU Pro ได้ 77.2% และการทดสอบคณิตศาสตร์แข่งขัน AIME 2026 ได้ 77.5% ในการทดสอบเขียนโค้ด LiveCodeBench มันทำคะแนนได้ 72.5% แสดงให้เห็นถึงความสามารถในทางปฏิบัติที่แข็งแกร่งในการทำงานแบบเอเจนต์ (Agentic Workflows) และการให้เหตุผลแบบหลายขั้นตอน
ผลิตภัณฑ์ตัวที่สามคือ Google AI Edge Eloquent แอปพลิเคชันป้อนตามคำบอกที่วางตำแหน่งตัวเองเป็นทางเลือกฟรีโดยตรงสำหรับบริการถอดข้อความแบบเสียเงิน แอปนี้ขับเคลื่อนโดยโมเดลที่ใช้ Gemma เป็นฐานและถูกออกแบบมาให้ทำงานแบบออฟไลน์เป็นหลัก (offline-first) ตั้งแต่แรก
มันเหนือกว่าการถอดความธรรมดา โดยการทำหน้าที่เป็นเครื่องมือขัดเกลาคำพูดอัตโนมัติ มัน "ตัดทิ้งอย่างจริงจัง" ซึ่งคำฟุ่มเฟือยเช่น "อืม" และ "เอ่อ" แก้ไขไวยากรณ์ให้ถูกต้องในทันที และปรับโครงสร้างคำพูดที่ดิบและยุ่งเหยิงให้เป็นข้อความที่สละสลวยและดูเป็นมืออาชีพ นี่ทำให้มันเป็นเหมือนเครื่องมือสื่อสารมากกว่าแอปจดบันทึก ข้อแตกต่างสำคัญคือราคา: ไม่มีการสมัครสมาชิกและไม่มีขีดจำกัดการใช้งาน
เวอร์ชัน macOS ต้องใช้ macOS 13.0 หรือใหม่กว่าและชิป Apple M1 หรือใหม่กว่า แม้ว่าหน้า App Store จะระบุว่าคุณสมบัติเสริมขั้นสูงบางอย่างอาจต้องใช้การประมวลผลบนคลาวด์
การเปิดตัวครั้งนี้ได้สร้างปรัชญาที่เป็นขั้วตรงข้ามกันสองแบบสำหรับ AI ท้องถิ่น กลยุทธ์ของ Google คือแนวทางแบบ "สวนปิด": คอลเลกชันโมเดลที่คัดสรรและรับรองโดย Google, ผสานรวมอย่างแน่นหนากับแอปพลิเคชันของตัวเอง (Gallery สำหรับการสำรวจ, Eloquent สำหรับการป้อนตามคำบอก), และเครื่องมืออนุมานแบบครบวงจร (LiteRT-LM) พร้อม CLI และ Python API เป้าหมายคือการมอบประสบการณ์ระดับผู้บริโภคที่ราบรื่นและ "ใช้ได้เลย" ทันทีที่แกะกล่อง
สิ่งนี้แตกต่างอย่างสิ้นเชิงกับ Ollama และ LM Studio ซึ่งให้ความสำคัญกับความยืดหยุ่นและตัวเลือกสูงสุด ในฐานะไลบรารีเปิดที่ผู้ใช้สามารถดึงโมเดลอะไรก็ได้ที่เข้ากัน ที่น่าสนใจคือ ทั้ง Ollama และ LM Studio รองรับโมเดลโอเพนเวท Gemma 4 12B อยู่แล้ว ดังนั้นโมเดลของ Google จึงไม่ได้ผูกขาดกับสแต็กของตัวเอง
ข้อได้เปรียบของ Google อยู่ที่การปรับแต่งจากต้นทาง ซึ่งโมเดลของตัวเองได้รับการปรับจูนมาเฉพาะสำหรับเครื่องมืออนุมานของตัวเองบน Apple Silicon เพื่อประสิทธิภาพที่ดีขึ้นและการใช้หน่วยความจำที่ต่ำลง สิ่งที่ผู้ใช้ต้องแลกนั้นชัดเจน: คุณจะได้รับประสบการณ์ที่สวยงามและผสานรวมกันมากขึ้น แต่คุณจะไม่สามารถรันโมเดลนอกเหนือจากตระกูล Gemma ที่ Google คัดสรรมาได้ นี่คือการวางตำแหน่งให้ Google คว้าผู้ใช้ที่ให้ความสำคัญกับความน่าเชื่อถือและความง่ายในการใช้งานมากกว่าเสรีภาพในการทดลอง ซึ่งทำให้เกิดทางแยกที่ชัดเจนสำหรับเส้นทางของ AI ท้องถิ่นบน Mac
Comments
0 comments