레딧 사용자 u/tadanada는 이러한 비용 급증을 정량화한 분석을 게시하며 제미나이 3.5 플래시의 벤치마크 완료 비용이 1,552달러인데 반해, 제미나이 3 플래시는 278달러라고 지적했습니다. 이 5.6배의 차이는 유료 플랜이 왜 그렇게 빨리 소진되는지를 명확히 설명해 주었습니다 .
구글의 대응은 두 단계로 이루어졌습니다.
하지만 9배나 늘린 할당량조차 완전한 해결책은 아니었습니다. 일부 개발자들은 할당량 초기화 후 작업을 재개한 지 30분 만에 다시 주간 플래시 사용 제한에 걸렸다고 보고했습니다 .
제미나이 3.5 플래시 로우는 더 근본적인 해결책을 제시합니다. 개발자에게 단순히 더 많은 원재료 할당량(공급 측면의 임시방편)을 주는 대신, 작업당 더 적은 토큰을 사용할 수 있는 방법(수요 측면의 제어)을 제공한 것입니다.
구글의 공식 문서에 따르면, 로우 변종은 "더 적은 단계가 필요한 코드 및 에이전트 작업에 맞춰 대폭 개선되어, 낮은 지연 시간과 비용으로도 강력한 품질을 제공" 합니다 . 구글은 로우 변종이 현재 '미디엄'으로 이름이 변경된 기존 변종보다 약 45% 더 적은 출력 토큰을 생성한다고 밝혔습니다
.
이제 개발자들은 간단한 코드 생성, 단순 완료, 가벼운 에이전트 루프에는 API 호출 시 명시적으로 thinking_level: "low".
제미나이 3.5 플래시 출시 당시 API에는 거의 알려지지 않은 큰 함정이 하나 있었습니다. 바로 기본 thinking_level이 high에서 medium으로 변경된 것입니다. gemini-3-flash-preview에서 별도 설정 없이 그대로 마이그레이션한 개발자들은 자신도 모르는 사이에 과거와는 다른, 다소 약화된 추론 결과를 받고 있었습니다 . 따라서 로우 변종이 출시된 후에도, 많은 개발자들은 기본값이 바뀌었다는 사실을 눈치채지 못해 간단한 작업에 여전히 필요 이상의 토큰을 소비하고 있었던 것입니다.
로우 변종은 본질적으로 이 문제의 마무리 수정입니다. 이는 플래시 제품군이 원래 설계된 목표인 비용에 민감한 작업을 위해, 명시적이고 문서화된, 목적에 맞게 구축된 수준을 개발자에게 제공합니다.
제미나이 3.5 플래시 로우의 출시는 9배 할당량 증가 및 기본 사고 수준 조정과 결합되어 안티그래비티 개발자 경험을 안정시켰습니다. 이제 개발자들은:
로우 변종은 구글의 할당량 증가를 대체하는 것이 아니라 보완하는 것입니다. 새로운 사고 수준과 9배로 확장된 할당량을 함께 사용하는 개발자들은 이제 한계에 도달하거나 오후 한나절 만에 월간 예산을 모두 소진하지 않고도 의미 있는 코딩 세션을 진행할 수 있습니다.
Comments
0 comments