← Back to Trending

答え公開済み2 か月前Last edited 先月25 ソース

Gemini 3.5 Flash「Low」開発者を救った静かな修正

Gemini 3.5 Flash Lowは、開発者からの猛烈なトークン消費への反乱が生んだ産物だ。デフォルトの「考える」挙動が原因で、1時間も経たずにクオータが尽き、タスク実行コストは先代モデルの5.5倍に跳ね上がっていた。 Lowバリアントは、Mediumに改名された元のバリアントと比較して出力トークンを約45%削減。シンプルなタスクでコストを抑えつつ、複雑な問題には深い思考モードを温存できる、明確なコントロール手段を開発者に提供する。

Studio Global AIで検索して事実確認さらにトレンドページを見る

Google Gemini 3.5 Flash model configuration interface showing thinking level options with the Low variant highlighted — What prompted Google to introduce the "Low" thinking level in Gemini 3.5 Flash on Antigravity, and how does this change address developer frGoogle's Gemini 3.5 Flash now offers four thinking levels—including the new Low variant—giving developers direct control over token consumption and cost per task.
AI プロンプト
Create a landscape editorial hero image for this Studio Global article: What prompted Google to introduce the "Low" thinking level in Gemini 3.5 Flash on Antigravity, and how does this change address developer fr. Article summary: Google introduced the **Gemini 3.5 Flash (Low)** thinking level in Antigravity in direct response to a firestorm of developer backlash triggered by the model's launch at I/O 2026 on May 19. The core problem: Gemini 3.5 F. Topic tags: general, general web, user generated. Reference image context from search candidates: Reference image 1: visual subject "Product naming/UX confusion around Gemini CLI vs Antigravity CLI and broader interface design criticism (zachtratar, kchonyc, teortaxesTex). ## Gemini 3.5 Flash: the main technica" source context "[AINews] Google I/O 2026: Gemini 3.5 Flash, Omni (NanoBanana for ..." Reference image 2: visual subject "4M views • 6
openai.com

Googleが2026年5月19日のI/OでGemini 3.5 Flashを発表した時、それは同社最強の「エージェント・コーディング」モデルとして期待を集めた。しかしその直後を襲ったのは、開発者たちの怒号、緊急のクオータ変更、そしてモデルの「思考法」を根本から書き換える静かな軌道修正だった。

問題の核心はここにある： Gemini 3.5 Flashのデフォルトの思考挙動は、あまりに積極的にトークンを消費した。その結果、有料のAntigravityユーザーは1時間も経たずに割り当てを使い果たしてしまったのだ。100万入力トークンあたり1.50ドル、出力トークンあたり9.00ドルという単価は競争力があるように見えた。しかし、実際のタスク完了にかかる総コストは全く別の物語を語っていた。Artificial Analysisの調査によると、標準ベンチマークスイートの実行コストは、Gemini 3.5 Flashで1,552ドル。これに対し、前世代のGemini 3 Flashは282ドルで済んでいた。実に5.5倍もの増加である。

Googleを動かした開発者たちの反乱

開発者の不満は瞬く間に噴出した。Antigravityのフォーラム、Reddit、Xは、極端なクオータ消費への苦情であふれかえった。AntigravityのProプランに課金していた開発者たちは、以前なら丸一日使えたクオータが、Gemini 3.5 Flashに切り替えた途端、30分から60分で消え去ると報告した。

Studio Global AI

Search, cite, and publish your own answer

Use this topic as a starting point for a fresh source-backed answer, then compare citations before you share it.

Studio Global AIで検索して事実確認

人々も尋ねます

「Gemini 3.5 Flash「Low」開発者を救った静かな修正」の短い答えは何ですか?

Gemini 3.5 Flash Lowは、開発者からの猛烈なトークン消費への反乱が生んだ産物だ。デフォルトの「考える」挙動が原因で、1時間も経たずにクオータが尽き、タスク実行コストは先代モデルの5.5倍に跳ね上がっていた。

最初に検証する重要なポイントは何ですか?

Gemini 3.5 Flash Lowは、開発者からの猛烈なトークン消費への反乱が生んだ産物だ。デフォルトの「考える」挙動が原因で、1時間も経たずにクオータが尽き、タスク実行コストは先代モデルの5.5倍に跳ね上がっていた。 Lowバリアントは、Mediumに改名された元のバリアントと比較して出力トークンを約45%削減。シンプルなタスクでコストを抑えつつ、複雑な問題には深い思考モードを温存できる、明確なコントロール手段を開発者に提供する。

次の実践では何をすればいいでしょうか？

この機能は、緊急のクオータ9倍増と、デフォルト思考レベルが「high」から「medium」へ密かに変更されたのと同時期、Google I/O 2026から1週間以内に実装されたものだ。

情報源

開発者にとって、これは何を意味するのか。簡単なコード生成や、軽量なエージェントループのような処理では、API呼び出しで明示的に


thinking_level: "low"

と設定し、本当に高度な推論が必要なタスクのためにより高い思考予算を温存できるようになったのだ。NxCodeが開発者ガイドで「lowはほとんどのエージェントコーディングに最適な設定だ」と指摘する通り、Googleはコードやツール呼び出しのワークフロー向けに特別に再調整を施したのである。

日々のコーディングや、Bootstrapのレイアウト、PHPのロジックなど深い思考が必要ないタスクには
```
thinking_level: "low"
```
を使う。
複数ファイルにまたがる自律的な実行や複雑なエージェントループのために、MediumやHighの思考モードを予約しておく。
Flashモデルが歴史的に提供してきた水準に近いトークン消費で済むようになったため、タスクごとのコストをより予測可能な形で追跡できる。