Google verschiebt Gemini 3.5 Pro von Juni auf Juli – ein weiteres Mal, nachdem CEO Sundar Pichai bei der I/O 2026 noch „einen Monat“ versprochen hatte. Gemini 3.5 Flash dagegen erschien pünktlich zur I/O und übertrifft das bisherige Gemini 3.1 Pro in 11 von 15 agentischen Benchmarks – bei vierfacher Geschwindigkeit...

Create a landscape editorial hero image for this Studio Global article: Search & fact-check with cited sources for Search & fact-check with cited sources for What led to Google delaying the release of Gemini 3.5. Article summary: Google has pushed Gemini 3.5 Pro's release from June to July to gather more real-world feedback from early testers and make performance tweaks, after CEO Sundar Pichai already drew audible audience groans at I/O 2026 by . Topic tags: general, general web, user generated. Style: premium digital editorial illustration, source-backed research mood, clean composition, high detail, modern web publication hero. Use reference image context only for broad subject, composition, and topical grounding; do not copy the exact image. Avoid: logos, brand marks, copyrighted characters, real person likenesses, fake screenshots, UI text, readable text, watermarks, charts with fak
Google hat den Release von Gemini 3.5 Pro von Juni auf Juli verschoben. Grund seien Leistungsprobleme bei frühen Tests – nicht etwa Sicherheits- oder Infrastruktur-Probleme . CEO Sundar Pichai kündigte die Verzögerung erstmals auf der Google I/O am 19. Mai 2026 an und sagte dem Live-Publikum, das Modell sei „noch nicht bereit“; er bat um „einen weiteren Monat“ – ein Satz, der laut Business Insider mit hörbarem Stöhnen aufgenommen wurde
. Ende Juni ist das Modell weiterhin nur als eingeschränkte Vertex-AI-Vorschau für ausgewählte Enterprise-Kunden verfügbar
.
Im Gegensatz dazu startete Gemini 3.5 Flash termingerecht zur I/O und setzte sofort neue Maßstäbe: Es übertrifft das bisherige Gemini 3.1 Pro in den meisten Coding- und Agenten-Benchmarks bei etwa vierfacher Geschwindigkeit und 25–40 % geringeren Kosten pro Token . Entwickler äußern Frust über Googles Schweigen und die wiederholt verpassten Termine, besonders da Wettbewerber wie OpenAI und Anthropic weiterhin regelmäßig neue Modelle veröffentlichen
.
Die Verzögerung liegt in Qualitätsproblemen bei der Leistung begründet, die bereits in frühen Tests auftraten . Google nutzt die zusätzliche Zeit, um Feedback von Testern zu sammeln und das Modell an realen Geschäftsanwendungen auszurichten
. Leaks in sozialen Medien deuten darauf hin, dass frühe Tester dem Modell bescheinigten, „bei schwierigen Aufgaben nachlässig zu werden“, woraufhin Google den Start verschob und eine Auslieferung mit Verbesserungen wie 2-Millionen-Token-Kontextfenster und Deep Think Reasoning anstrebt
.
Pichais Ankündigung im Mai setzte die Erwartungen schlecht. „I know you can't wait to get your hands on it. Gebt uns bis nächsten Monat, um es euch zu liefern“, sagte er . Einen konkreten Grund für die Verzögerung nannte er nicht
. Als dann auch der Juni-Termin ohne offizielle Erklärung verstrich, entstand der Eindruck eines gebrochenen Versprechens
.
Gemini 3.5 Flash wurde am 19. Mai 2026 – also am Tag der Ankündigung – allgemein verfügbar gemacht und stellte sofort die bisherige Pro-Hierarchie auf den Kopf .
Wichtige Benchmark-Ergebnisse von Google:
Google zufolge ist 3.5 Flash etwa 4x schneller bei den Output-Tokens pro Sekunde als andere Frontier-Modelle . Die API-Preise liegen bei rund 1,50 $ Input / 9 $ Output pro Million Tokens – etwa 40 % günstiger als Gemini 3.1 Pro beim Input
.
In 11 von 15 veröffentlichten Benchmarks schlägt Gemini 3.5 Flash Gemini 3.1 Pro . Allerdings bleibt es bei reinen Reasoning-Benchmarks wie Humanity’s Last Exam (40,2 % vs. 44,4 %) und ARC-AGI-2 (72,1 % vs. 77,1 %) hinter dem Pro-Modell zurück, ist also kein reines Upgrade in jeder Hinsicht
.
Die Entwickler reagieren scharf auf Googles Kommunikationsstil und das Tempo.
Wenn Gemini 3.5 Pro erscheint, soll es die Reasoning-Lücken schließen, die Flash noch aufweist. Bestätigte Funktionen sind ein 2-Millionen-Token-Kontextfenster – das größte aller Produktionsmodelle – und ein Deep Think Reasoning-Modus . Die Preise werden voraussichtlich bei rund 1,50 $ Input / 9 $ Output pro Million Tokens liegen, ähnlich der Flash-Stufe
.
Die Verzögerung, so ärgerlich sie für Entwickler ist, könnte letztlich zu einem stärkeren Produkt führen. Doch Googles faires „nächsten Monat“-Versprechen, gefolgt von Schweigen, hat die Frustration in der Community verstärkt – vor dem Hintergrund beständiger Veröffentlichungen der Konkurrenz.
Fazit: Die Verzögerung hat Leistungsgründe, keine Sicherheits- oder Infrastruktur-Probleme. In der Zwischenzeit ist Gemini 3.5 Flash die beste Option für produktive Agenten-Workloads – eine kostengünstige Alternative, die das letztjährige Pro-Modell in den Benchmarks übertrifft, die für Entwickler am wichtigsten sind.
Studio Global AI
Use this topic as a starting point for a fresh source-backed answer, then compare citations before you share it.
Google verschiebt Gemini 3.5 Pro von Juni auf Juli – ein weiteres Mal, nachdem CEO Sundar Pichai bei der I/O 2026 noch „einen Monat“ versprochen hatte.
Google verschiebt Gemini 3.5 Pro von Juni auf Juli – ein weiteres Mal, nachdem CEO Sundar Pichai bei der I/O 2026 noch „einen Monat“ versprochen hatte. Gemini 3.5 Flash dagegen erschien pünktlich zur I/O und übertrifft das bisherige Gemini 3.1 Pro in 11 von 15 agentischen Benchmarks – bei vierfacher Geschwindigkeit und 25–40 % niedrigeren Kosten pro Token [23][24].
Entwickler kritisieren Googles Schweigen und die wiederholt verpassten Termine, während Konkurrenten wie OpenAI und Anthropic regelmäßig Updates ausliefern [5][8].
Loading comments...
Comments
0 comments