컴퓨트 기반 시스템의 가장 어이없는 태생적 죄악은 아마도 실패한 요청조차 할당량을 소비한다는 점이었을 것이다. 유용한 출력물을 전혀 생성하지 않은 내부 서버 오류, 시간 초과, 혹은 버그조차 사용자의 사용량 타이머를 줄였다.
구글은 이제 이것을 완전히 없앴다. 할당량은 오로지 성공적으로 완료된 요청에 대해서만 차감된다. 우드워드는 이를 간단명료하게 요약했다: "요청이 실패하면, 당신에게 비용이 청구되지 않을 것입니다. 우리 시스템의 실수는 우리 책임이지, 당신 책임이 아닙니다" . 이는 할당량이 실제보다 훨씬 더 적게 느껴지게 만들던 원인 중 하나인, 눈에 보이지 않는 할당량 소진의 주요 원천을 제거한 조치다.
제미나이 Omni 기반 동영상 도구의 특정 버그로 인해 일부 사용자는 동영상을 한두 개 생성하는 것만으로도 전체 할당량이 소진되는 현상을 겪고 있었다 . 이 버그는 동영상 프로젝트에서 완전히 이용 정지를 당하지 않고는 반복 작업이나 실수 수정을 하는 것이 불가능하게 만들었기 때문에 특히나 치명적이었다.
구글은 이 버그가 해결되었음을 확인했다. 이에 더해 보상 차원에서 서비스를 개선하기 위해, 구글은 Google AI Ultra 구독자를 위한 Omni 동영상 생성 한도를 동시에 두 배로 늘려 즉시 더 많은 여유를 제공했다 .
모든 사용자에게 절대 좌초되지 않을 신뢰할 수 있는 옵션을 제공하기 위해, 구글은 제미나이 3.1 Flash-Lite 프롬프트를 모든 할당량 계산에서 제외시켰다. 이제 Flash-Lite 질의는 5시간 또는 주간 한도 계산에 전혀 컴퓨트 비용을 소모하지 않는다 . 이는 사용자의 Pro 또는 Ultra 할당량이 완전히 소진되더라도 기본적인 텍스트 생성이나 비교적 가벼운 코딩 작업은 중단 없이 계속될 수 있음을 보장한다.
원래 불만의 상당 부분은 정확한 측정기의 부재에서 비롯되었다. 사용자들은 서비스가 끊기기 직전까지 제한에 도달하고 있다는 사실을 전혀 모르는 경우가 많았으며, 특히 복잡한 프롬프트 하나가 소비량을 0%에서 100%로 순간 이동시키는 상황에서는 더욱 그러했다.
구글은 특히 심층 연구(Deep Research)와 같은 컴퓨트 집약적인 작업에 대해 더 상세한 사용량 분석 및 향상된 알림을 제공하겠다고 약속했다 . 또한 회사는 갑작스러운 중단에 놀라지 않고 사용자가 실시간으로 소비량을 이해할 수 있도록 지원하는, 보다 포괄적인 대시보드를 준비 중이다.
사소하지만 삶의 질을 높여주는 개선 사항으로, 이제 사용자가 선택한 모델(예: 제미나이 3.1 Pro)은 여러 세션에 걸쳐 고정된다. 수동으로 전환하거나 사용량 제한에 도달하여 Flash와 같은 더 가벼운 모델로의 자동 폴백이 발동되는 경우에만 변경된다 . 이는 Pro로 작업을 시작했는데 조용히 낮은 사양으로 강등당하는 불쾌한 경험을 막아준다.
새로운 시스템의 핵심 아키텍처는 여전히 그대로라는 점을 유념해야 한다. 구글은 여전히 단순한 메시지 기반 모델이 아닌 컴퓨트 기반 모델을 사용하고 있으며, 유료 플랜에는 여전히 5시간 단위 롤링 윈도우와 주간 최대 한도가 적용된다 . 또한 회사는 궁극적으로 제미나이 앱 내에서 사용량 기반 추가 과금 방식의 'AI 크레딧'을 판매할 의사가 있음을 시사하여, 과도하게 사용하는 유저가 직접 더 많은 컴퓨트 자원을 구매할 수 있도록 할 예정이다
.
Comments
0 comments