DeepSeek macht V4-Pro-Preissenkung dauerhaft: $0,87 pro Million Output-Token, 34x günstiger als GPT-5.5
Kurzfassung
DeepSeek macht seinen 75%-Rabatt auf die V4-Pro-API dauerhaft: Output-Token zu $0,87 pro Million, 34-mal günstiger als GPT-5.5. Das ist kein Sonderangebot, sondern ein gezielter Angriff auf die Preismacht westlicher KI-Labore.
Am 22. Mai gab DeepSeek bekannt, dass der Rabatt auf die V4-Pro-API nicht ausläuft.
Was ursprünglich als befristete Aktion bis zum 31. Mai geplant war, wird zum Dauertarif. Output-Token kosten jetzt dauerhaft $0,87 pro Million. Input-Token $0,435. Cache-Hits sogar nur $0,003625, in manchen Szenarien ein Rückgang um 90% gegenüber den ursprünglichen Preisen. Zum Vergleich: DeepSeek V4-Pro ist damit rund 34-mal günstiger als GPT-5.5 bei Output-Token.
Was die Zahlen bedeuten
Alte V4-Pro-Preise: $1,74 pro Million Input-Token, $3,48 pro Million Output-Token. Die neuen Dauerpreise halbieren jeweils auf ein Viertel. Für Engineering-Teams mit Dutzenden Millionen API-Aufrufen täglich bedeutet das 75 bis 80 Prozent weniger Inferenzkosten. Das ist keine marginale Ersparnis.
V4-Pro basiert auf einer Mixture-of-Experts-Architektur mit 1,6 Billionen Gesamtparametern, von denen je Inferenzaufgabe rund 49 Milliarden aktiviert werden. Das Kontextfenster umfasst eine Million Token. In mehreren Benchmarks konkurriert das Modell direkt mit GPT-5.5 und Claude Opus 4.7 auf vergleichbarem Niveau.
Warum DeepSeek diese Preise halten kann
Der entscheidende Faktor ist die Hardware-Strategie. DeepSeek hat V4-Pro von Anfang an für Huawei Ascend 950PR-Chips optimiert, nicht für Nvidia-GPUs.
Westliche Labore zahlen weiterhin Nvidia-H100/H200-Preise. DeepSeek umgeht diese Lieferkette. Counterpoint-Research-Analyst Wei Sun stellte fest, dass die wachsende Ascend-Produktion, mit einem angestrebten 2,5-fachen Anstieg gegenüber dem Vorjahr, der strukturelle Grund ist, warum DeepSeek diese Preise langfristig halten kann. Die MoE-Architektur verstärkt den Vorteil: Jede Inferenz aktiviert nur etwa 3% der Gesamtparameter, was die Rechenkosten pro Token deutlich senkt.
Entwicklerbindung als eigentliches Ziel
Die Strategie erinnert an AWS im Jahr 2006. Amazon bot Cloud-Computing damals zu nahezu kostendeckenden Preisen an, um Entwickler-Workflows zu gewinnen, und ließ die Wechselkosten dann die Arbeit erledigen. DeepSeek scheint dasselbe Playbook zu verfolgen. Produktionssysteme jetzt an die API binden, und später anders monetarisieren.
Ein aufschlussreiches Detail: V4-Pro unterstützt das Anthropic-API-Interface-Format. Engineers, die bereits Claude SDKs einsetzen, können bestehenden Code mit minimalen Änderungen auf DeepSeek umstellen. Die Migrationsbarriere ist bewusst niedrig gehalten.
Der Druck auf die Konkurrenz
Aktuelle Output-Preise im Vergleich:
| Modell | Output pro Million Token |
|---|---|
| DeepSeek V4-Pro | $0,87 |
| Gemini 3.5 Flash | $9,00 |
| GPT-5.5 | ca. $30,00 |
| Claude Opus 4.7 | ca. $30,00 |
Dieser Abstand ist schwer zu rechtfertigen, wenn allein die Kosten betrachtet werden. Westliche Labore müssen auf andere Differenzierungsmerkmale setzen: Datenschutz, Compliance, Einkaufsrichtlinien von Behörden oder Ökosystem-Lock-in. Diese Argumente existieren, werden aber schwerer, je mehr sich die Leistungslücken schließen.
Anthropic hat DeepSeek öffentlich der Destillationsattacken beschuldigt, wonach das Unternehmen Claude-Ausgaben verwendet haben soll, um eigene Modelle zu trainieren. Im März stufte die Trump-Administration Anthropic als “Lieferkettenrisiko” ein und wies Bundesbehörden an, Claude-Produkte nicht mehr zu nutzen. DeepSeeks Preisoffensive findet vor diesem geopolitischen Hintergrund statt.
Für Entwickler, die abwägen, wohin sie ihre Workloads lenken, hat sich die Rechnung diese Woche erneut verschoben. Die Frage ist nicht mehr, ob V4-Pro es wert ist, getestet zu werden. Die Frage ist, ob Compliance und Vertrauensprofil zum jeweiligen Anwendungsfall passen.
Wenn dieser Artikel hilfreich war, abonniere den Newsletter für wöchentliche KI-PM-Einblicke.
Weiterführende Artikel
Verwandte Artikel
Fable-5-Verbot Tag 7: Das Weiße Haus fordert Zero-Jailbreaks, Experten sagen technisch unmöglich
Tag 7 des Fable-5-Verbots: Das Weiße Haus fordert vollständige Jailbreak-Sicherheit vor dem Neustart. Sicherheitsexperten sind sich einig: Das ist technisch unmöglich für jedes Frontier-Modell, und Dario Amodei hat bereits beide Lösungsvorschläge der Regierung abgelehnt.
US-Regierung zwingt Anthropic zur Abschaltung von Fable 5 und Mythos 5: Ein „schmaler Jailbreak” legt die stärksten Modelle lahm
Das US-Handelsministerium ordnete die Sperrung von Anthropics leistungsstärksten Modellen Fable 5 und Mythos 5 an – ausgelöst durch einen engen Jailbreak mit Cybersicherheitsbezug. Anthropic folgte der Anweisung und widersprach ihr gleichzeitig.