ความไม่พอใจของนักพัฒนาปะทุขึ้นแทบจะในทันที ฟอรัมของ Antigravity, Reddit, และ X (Twitter) เต็มไปด้วยข้อร้องเรียนเรื่องการบริโภคโควต้าที่มากเกินไป โดยนักพัฒนาที่จ่ายเงินสำหรับแผน Pro ของ Antigravity รายงานว่า โควต้าที่เคยใช้ได้ทั้งวัน กลับถูกใช้หมดไปภายใน 30 ถึง 60 นาที หลังจากเปลี่ยนมาใช้ Gemini 3.5 Flash
มีการโพสต์วิเคราะห์ตัวเลขลง Reddit โดยผู้ใช้ u/tadanada ที่ชี้ให้เห็นถึงเงินเฟ้อของค่าใช้จ่ายอย่างชัดเจน โดยเปรียบเทียบค่าใช้จ่ายในการรัน Benchmark ที่ 1,552 ดอลลาร์สหรัฐ สำหรับ Gemini 3.5 Flash และเพียง 278 ดอลลาร์สหรัฐสำหรับ Gemini 3 Flash ซึ่งเป็นส่วนต่างมหาศาลที่อธิบายว่าทำไมแผนแบบเสียเงินถึงถึงลิมิตเร็วผิดปกติ
การตอบสนองของ Google มาในสองระลอกใหญ่:
high (สูง) ลงมาเป็น medium (กลาง) อย่างเงียบๆ อย่างไรก็ตาม การเพิ่มโควต้าถึง 9 เท่าก็ยังแก้ปัญหาไม่ได้ทั้งหมด นักพัฒนาบางรายรายงานว่าพวกเขาใช้โควต้ารายสัปดาห์ของ Flash จนถูกล็อกเอาท์ภายในเวลาเพียง 30 นาที หลังจากที่เพิ่งได้รับการรีเซ็ตโควต้าไปหมาดๆ
การมาของ Gemini 3.5 Flash Low ไม่ได้เป็นเพียงการแจกโควต้าเพิ่ม (ซึ่งเป็นเหมือนไม้ตายด้านซัพพลาย) แต่มันคือการแก้ไขที่แม่นยำกว่า โดยให้เครื่องมือแก่นักพัฒนาในการใช้โทเค็นน้อยลงต่องาน (การควบคุมด้านดีมานด์)
เอกสารทางการของ Google อธิบายว่ารุ่น Low นี้ถูก "ปรับปรุงให้ดีขึ้นอย่างมากสำหรับงานเขียนโค้ดและ Agentic ที่ต้องการขั้นตอนน้อยลง โดยมอบคุณภาพที่แข็งแกร่งด้วยเวลาแฝง (Latency) และค่าใช้จ่ายที่ต่ำกว่า" โดยบริษัทระบุว่ารุ่น Low สร้างจำนวน Output Token น้อยลงประมาณ 45% จากรุ่นที่เปลี่ยนชื่อเป็น Medium ในขณะนี้
สำหรับนักพัฒนาแล้ว นี่หมายความว่าพวกเขาสามารถตั้งค่า thinking_level: "low"
พูดง่ายๆ ก็คือ สิ่งนี้ทำให้นักพัฒนามี "ปุ่มหมุน" สำหรับปรับระดับความพยายามในการคิด (Reasoning Effort) ได้ถึง 4 ระดับ—minimal, low, medium, high—แทนที่จะมีแค่สองตัวเลือกคือ "เปิดการคิด" หรือ "ปิดการคิด"
หนึ่งในกับดัก API ครั้งใหญ่ที่สุดของการเปิดตัว Gemini 3.5 Flash คือการเปลี่ยนค่าพื้นฐาน thinking_level จาก high เป็น medium โดยไม่ได้แจ้งให้ทราบอย่างชัดเจน นักพัฒนาที่ย้ายโปรเจกต์มาจาก gemini-3-flash-preview โดยตรงโดยไม่ได้ตั้งค่าระดับการคิดอย่างชัดเจน จะต้องพบกับพฤติกรรมการคิดที่เปลี่ยนไปแบบไม่รู้ตัว นั่นหมายความว่า แม้ว่ารุ่น Low จะถูกส่งมาให้ใช้แล้ว นักพัฒนาหลายคนก็ยังคงใช้โทเค็นมากเกินความจำเป็นสำหรับงานง่ายๆ เพราะพวกเขาไม่ได้สังเกตว่าค่าเริ่มต้นถูกเปลี่ยนไปแล้ว
การมาของรุ่น Low ทำหน้าที่เป็นการแก้ไขที่สมบูรณ์ขึ้น คือมันมอบระดับการคิดที่ชัดเจน มีเอกสารยืนยัน และถูกสร้างมาเพื่อจุดประสงค์เฉพาะสำหรับงานที่อ่อนไหวต่อค่าใช้จ่าย ซึ่งเป็นสิ่งที่โมเดลตระกูล Flash ถูกออกแบบมาให้ทำตั้งแต่แรก
การเปิดตัว Gemini 3.5 Flash Low ประกอบกับการเพิ่มโควต้า 9 เท่า และการปรับระดับการคิดพื้นฐาน ได้สร้างสมดุลให้กับประสบการณ์การใช้งาน Antigravity ของนักพัฒนากลับคืนมา ตอนนี้นักพัฒนาสามารถ:
thinking_level: "low"Flash Low ไม่ใช่การแทนที่การเพิ่มโควต้า แต่มันคือส่วนเติมเต็มให้สมบูรณ์ นักพัฒนาที่ใช้ทั้งระดับการคิดใหม่และโควต้าที่ขยายขึ้นถึง 9 เท่า จะสามารถทำงานพัฒนาโปรเจกต์เขียนโค้ดที่มีความหมายได้ โดยไม่ต้องกังวลว่าจะถูกล็อกเอาท์กลางคัน หรือใช้เงินค่า Antigravity หมดไปภายในบ่ายวันเดียวอีกต่อไป
Comments
0 comments