Gemini 3.5 Pro verpasst den Juni-GA: Sechs Wochen nach Google I/O warten Entwickler noch

Meine These lautet: Die Verschiebung von Gemini 3.5 Pro schadet Google gerade dann am meisten, wenn Enterprise-Kunden ihre Q3-Budgets vergeben. Claude Fable 5 wurde am 23. Juni kostenpflichtig, OpenAI justiert gleichzeitig die o3-Preise, und das neutrale Evaluationsfenster schließt sich. Wenn Sie ein Unternehmen beraten, das gerade Flagship-LLM-Anbieter evaluiert: Hat die Verzögerung Ihre Empfehlung bereits beeinflusst, oder warten Sie auf den GA-Release? Und falls Sie Gemini 3.5 Pro trotzdem in die engere Auswahl nehmen, auf welcher Grundlage begründen Sie das gegenüber Entscheidern?

Am 19. Mai 2026, auf der Google I/O, kündigte Sundar Pichai an: Gemini 3.5 Flash sei ab sofort verfügbar, Gemini 3.5 Pro werde im nächsten Monat allgemein zugänglich. Sechs Wochen später ist der 24. Juni. Gemini 3.5 Pro befindet sich weiterhin nur in einer eingeschränkten Enterprise-Vorschau auf Vertex AI. Offizielle Preise wurden noch nicht veröffentlicht.

Der Prediction Market Polymarket schätzt die Wahrscheinlichkeit einer Veröffentlichung vor dem 30. Juni auf 50 bis 55 Prozent.

Versprechen und Realität

Gemini 3.5 Flash erschien wie angekündigt am Tag der I/O. Das Modell ist inzwischen über die Gemini API, Google Search AI Mode, Google Antigravity und weitere Kanäle verfügbar. Laut Googles offizieller Ankündigung erzielt Flash 76,2 Prozent auf Terminal-Bench 2.1 und 84,2 Prozent auf dem CharXiv-Multimodal-Reasoning-Benchmark. Diese Zahlen stammen von Google selbst und wurden nicht unabhängig verifiziert, aber Flash läuft nun seit sechs Wochen in realen Umgebungen.

Bei Pro sieht es anders aus. TechTimes berichtete am 6. Juni, dass das Modell kurz vor dem Start stehe. Am 24. Juni ist jedoch nur die begrenzte Enterprise-Vorschau über Vertex AI verfügbar. Der 30. Juni ist das letzte Datum, an dem das Versprechen des nächsten Monats noch technisch erfüllt werden könnte. Sechs Tage bleiben.

Drei Gründe, warum die Pro-Spezifikationen Aufmerksamkeit verdienen

Das 2-Millionen-Token-Kontextfenster ist die meistdiskutierte Spezifikation. Zum Vergleich: Claude Opus 4.8 kommt auf 200.000 Token, GPT-4.5 auf 128.000. Wenn Gemini 3.5 Pro tatsächlich 2 Millionen Token ohne Qualitätsverlust verarbeiten kann, wäre das ein struktureller Vorteil für Unternehmens-Workflows, die komplette Codebasen, vollständige Rechtsdokumente oder umfangreiche Finanzdaten verarbeiten müssen.

Der Deep Think-Reasoning-Modus ist Googles Interpretation der Kategorie langsames Denken: erst planen, dann reflektieren, dann ausgeben. Das Konzept ist vergleichbar mit dem Chain-of-Thought-Ansatz von OpenAI o3 und dem Extended Thinking von Claude. Ob die tatsächliche Reasoning-Qualität sich unterscheidet, lässt sich erst nach dem Launch mit unabhängigen Benchmarks messen.

Frontier-Multimodalität ist das Kernanliegen der 3.5-Serie. Flash erzielt bereits 84,2 Prozent auf CharXiv, was einen messbaren Fortschritt beim Verständnis strukturierter wissenschaftlicher Visualisierungen zeigt. Pro soll in diesem Bereich weiter vorne liegen, aber auch das lässt sich erst nach dem Launch verifizieren.

Was hinter den Zahlen steckt

Geschätzte Preisgestaltung: Gemini 3.5 Pro soll rund zehnmal so viel kosten wie Gemini 3.5 Flash, was etwa 15 US-Dollar pro Million Input-Token und 60 US-Dollar pro Million Output-Token entspräche.

Konkret bedeutet das: Ein einzelner Aufruf mit vollständig gefülltem 2-Millionen-Token-Kontext kostet allein an Input-Kosten rund 30 US-Dollar. Eine Enterprise-Pipeline mit 100 langen Kontextaufrufen pro Tag käme auf ungefähr 90.000 US-Dollar pro Monat. Bei diesem Preisniveau ist Pro eher ein Modell für wichtige Einzelentscheidungen als für alltägliche Abfragen.

Die Flash-Benchmarks verdienen einen genaueren Blick. Terminal-Bench 76,2 Prozent, GDPval-AA Elo 1.656, MCP Atlas 83,6 Prozent, alles von Google selbst gemessen. Das LMSYS Chatbot Arena Elo-Ranking spiegelt typischerweise besser die reale Nutzererfahrung wider. Dieser Wert wird erst ein bis zwei Wochen nach dem GA-Launch aussagekräftig, wenn die Community echte Erfahrungen gesammelt hat.

Eine konkrete technische Frage bleibt unbeantwortet: Sinkt die Qualität, wenn der Kontext sich dem 2-Millionen-Token-Limit nähert? Bei Modellen mit 128.000 bis 200.000 Token sind messbare Einbußen in der Retrieval-Precision über 80 Prozent Kontextfüllung dokumentiert. Falls Google dieses Problem auf Architekturebene nicht gelöst hat, könnte der nutzbare Bereich deutlich kleiner sein als die Headline-Zahl vermuten lässt.

Die Verzögerung hat auch einen Wettbewerbspreis. Claude Fable 5 wurde am 23. Juni kostenpflichtig. Unternehmenskunden, die ihre Anbieter neu bewerten, treffen Entscheidungen jetzt. Jede Woche, die Pro nicht verfügbar ist, ist eine Woche, in der Alternativen zuerst evaluiert werden.

Was es jetzt zu beobachten gilt

Der 30. Juni ist ein direkt überprüfbarer Datenpunkt: Erreicht Gemini 3.5 Pro vor Monatsende allgemeine API-Verfügbarkeit? Falls nicht, braucht Google im Juli eine neue Erklärung.

Nach dem GA-Release sind drei konkrete Kennzahlen im ersten Monat entscheidend. Erstens das LMSYS Chatbot Arena Elo-Ranking: Übertrifft Gemini 3.5 Pro Claude Opus 4.8 und GPT-4.5? Diese Community-Zahl hat mehr praktisches Gewicht als jeder interne Benchmark. Zweitens unabhängige Tests bei langen Kontexten: Bleibt die Retrieval-Precision über 100.000 Token stabil, oder gibt es einen systematischen Abfall? Das erfordert externe Forschung, keine Google-eigenen Ergebnisse. Drittens Enterprise-Kaufentscheidungen: Wo Fortune-500-Unternehmen ihr KI-Budget im Q3 konzentrieren, ist ein Proxy für den tatsächlichen Adoptionskurs von Pro.

Falls der 30. Juni ohne GA-Release vergeht, kommt diese Verzögerung zu einem bereits schwierigen Monat für Google DeepMind hinzu. Zwei prominente Forscher wechselten innerhalb einer Woche zur Konkurrenz. Die Flagship-Modelle der Wettbewerber wurden termingerecht geliefert. Je länger Gemini 3.5 Pro aus dem GA-Markt fehlt, desto schwieriger wird die Erklärung.

Wenn dieser Artikel hilfreich war, abonniere den Newsletter für wöchentliche KI-PM-Einblicke.

Gemini 3.5 Pro verpasst den Juni-GA: Sechs Wochen nach Google I/O warten Entwickler noch

Versprechen und Realität

Drei Gründe, warum die Pro-Spezifikationen Aufmerksamkeit verdienen

Was hinter den Zahlen steckt

Was es jetzt zu beobachten gilt

Verwandte Artikel

Google Antigravity CLI startet: Gemini CLI wird eingestellt

Noam Shazeer verlässt Google für OpenAI: Transformer-Miterfinder wechselt kurz vor dem Börsengang

Versprechen und Realität

Drei Gründe, warum die Pro-Spezifikationen Aufmerksamkeit verdienen

Was hinter den Zahlen steckt

Was es jetzt zu beobachten gilt

Verwandte Artikel

Google Antigravity CLI startet: Gemini CLI wird eingestellt

Noam Shazeer verlässt Google für OpenAI: Transformer-Miterfinder wechselt kurz vor dem Börsengang

Abonnieren Sie die neuesten Erkenntnisse