DeepSeek macht V4-Pro-Preissenkung dauerhaft: $0,87 pro Million Output-Token, 34x günstiger als GPT-5.5

Am 22. Mai gab DeepSeek bekannt, dass der Rabatt auf die V4-Pro-API nicht ausläuft.

Was ursprünglich als befristete Aktion bis zum 31. Mai geplant war, wird zum Dauertarif. Output-Token kosten jetzt dauerhaft $0,87 pro Million. Input-Token $0,435. Cache-Hits sogar nur $0,003625, in manchen Szenarien ein Rückgang um 90% gegenüber den ursprünglichen Preisen. Zum Vergleich: DeepSeek V4-Pro ist damit rund 34-mal günstiger als GPT-5.5 bei Output-Token.

Was die Zahlen bedeuten

Alte V4-Pro-Preise: $1,74 pro Million Input-Token, $3,48 pro Million Output-Token. Die neuen Dauerpreise halbieren jeweils auf ein Viertel. Für Engineering-Teams mit Dutzenden Millionen API-Aufrufen täglich bedeutet das 75 bis 80 Prozent weniger Inferenzkosten. Das ist keine marginale Ersparnis.

V4-Pro basiert auf einer Mixture-of-Experts-Architektur mit 1,6 Billionen Gesamtparametern, von denen je Inferenzaufgabe rund 49 Milliarden aktiviert werden. Das Kontextfenster umfasst eine Million Token. In mehreren Benchmarks konkurriert das Modell direkt mit GPT-5.5 und Claude Opus 4.7 auf vergleichbarem Niveau.

Warum DeepSeek diese Preise halten kann

Der entscheidende Faktor ist die Hardware-Strategie. DeepSeek hat V4-Pro von Anfang an für Huawei Ascend 950PR-Chips optimiert, nicht für Nvidia-GPUs.

Westliche Labore zahlen weiterhin Nvidia-H100/H200-Preise. DeepSeek umgeht diese Lieferkette. Counterpoint-Research-Analyst Wei Sun stellte fest, dass die wachsende Ascend-Produktion, mit einem angestrebten 2,5-fachen Anstieg gegenüber dem Vorjahr, der strukturelle Grund ist, warum DeepSeek diese Preise langfristig halten kann. Die MoE-Architektur verstärkt den Vorteil: Jede Inferenz aktiviert nur etwa 3% der Gesamtparameter, was die Rechenkosten pro Token deutlich senkt.

Entwicklerbindung als eigentliches Ziel

Die Strategie erinnert an AWS im Jahr 2006. Amazon bot Cloud-Computing damals zu nahezu kostendeckenden Preisen an, um Entwickler-Workflows zu gewinnen, und ließ die Wechselkosten dann die Arbeit erledigen. DeepSeek scheint dasselbe Playbook zu verfolgen. Produktionssysteme jetzt an die API binden, und später anders monetarisieren.

Ein aufschlussreiches Detail: V4-Pro unterstützt das Anthropic-API-Interface-Format. Engineers, die bereits Claude SDKs einsetzen, können bestehenden Code mit minimalen Änderungen auf DeepSeek umstellen. Die Migrationsbarriere ist bewusst niedrig gehalten.

Der Druck auf die Konkurrenz

Aktuelle Output-Preise im Vergleich:

Modell	Output pro Million Token
DeepSeek V4-Pro	$0,87
Gemini 3.5 Flash	$9,00
GPT-5.5	ca. $30,00
Claude Opus 4.7	ca. $30,00

Dieser Abstand ist schwer zu rechtfertigen, wenn allein die Kosten betrachtet werden. Westliche Labore müssen auf andere Differenzierungsmerkmale setzen: Datenschutz, Compliance, Einkaufsrichtlinien von Behörden oder Ökosystem-Lock-in. Diese Argumente existieren, werden aber schwerer, je mehr sich die Leistungslücken schließen.

Anthropic hat DeepSeek öffentlich der Destillationsattacken beschuldigt, wonach das Unternehmen Claude-Ausgaben verwendet haben soll, um eigene Modelle zu trainieren. Im März stufte die Trump-Administration Anthropic als “Lieferkettenrisiko” ein und wies Bundesbehörden an, Claude-Produkte nicht mehr zu nutzen. DeepSeeks Preisoffensive findet vor diesem geopolitischen Hintergrund statt.

Für Entwickler, die abwägen, wohin sie ihre Workloads lenken, hat sich die Rechnung diese Woche erneut verschoben. Die Frage ist nicht mehr, ob V4-Pro es wert ist, getestet zu werden. Die Frage ist, ob Compliance und Vertrauensprofil zum jeweiligen Anwendungsfall passen.

Wenn dieser Artikel hilfreich war, abonniere den Newsletter für wöchentliche KI-PM-Einblicke.

Weiterführende Artikel

DeepSeek macht V4-Pro-Preissenkung dauerhaft: $0,87 pro Million Output-Token, 34x günstiger als GPT-5.5

Was die Zahlen bedeuten

Warum DeepSeek diese Preise halten kann

Entwicklerbindung als eigentliches Ziel

Der Druck auf die Konkurrenz

Verwandte Artikel

Fable-5-Verbot Tag 7: Das Weiße Haus fordert Zero-Jailbreaks, Experten sagen technisch unmöglich

US-Regierung zwingt Anthropic zur Abschaltung von Fable 5 und Mythos 5: Ein „schmaler Jailbreak” legt die stärksten Modelle lahm

Was die Zahlen bedeuten

Warum DeepSeek diese Preise halten kann

Entwicklerbindung als eigentliches Ziel

Der Druck auf die Konkurrenz

Verwandte Artikel

Fable-5-Verbot Tag 7: Das Weiße Haus fordert Zero-Jailbreaks, Experten sagen technisch unmöglich

US-Regierung zwingt Anthropic zur Abschaltung von Fable 5 und Mythos 5: Ein „schmaler Jailbreak” legt die stärksten Modelle lahm

Abonnieren Sie die neuesten Erkenntnisse