← Zurück zu Einblicke

DeepSeek macht V4-Pro-Preissenkung dauerhaft: $0,87 pro Million Output-Token, 34x günstiger als GPT-5.5

Nils Liu
DeepSeek API Pricing GenAI Nachrichten

Kurzfassung

DeepSeek macht seinen 75%-Rabatt auf die V4-Pro-API dauerhaft: Output-Token zu $0,87 pro Million, 34-mal günstiger als GPT-5.5. Das ist kein Sonderangebot, sondern ein gezielter Angriff auf die Preismacht westlicher KI-Labore.

DeepSeek macht V4-Pro-Preissenkung dauerhaft: $0,87 pro Million Output-Token, 34x günstiger als GPT-5.5

Am 22. Mai gab DeepSeek bekannt, dass der Rabatt auf die V4-Pro-API nicht ausläuft.

Was ursprünglich als befristete Aktion bis zum 31. Mai geplant war, wird zum Dauertarif. Output-Token kosten jetzt dauerhaft $0,87 pro Million. Input-Token $0,435. Cache-Hits sogar nur $0,003625, in manchen Szenarien ein Rückgang um 90% gegenüber den ursprünglichen Preisen. Zum Vergleich: DeepSeek V4-Pro ist damit rund 34-mal günstiger als GPT-5.5 bei Output-Token.

Was die Zahlen bedeuten

Alte V4-Pro-Preise: $1,74 pro Million Input-Token, $3,48 pro Million Output-Token. Die neuen Dauerpreise halbieren jeweils auf ein Viertel. Für Engineering-Teams mit Dutzenden Millionen API-Aufrufen täglich bedeutet das 75 bis 80 Prozent weniger Inferenzkosten. Das ist keine marginale Ersparnis.

V4-Pro basiert auf einer Mixture-of-Experts-Architektur mit 1,6 Billionen Gesamtparametern, von denen je Inferenzaufgabe rund 49 Milliarden aktiviert werden. Das Kontextfenster umfasst eine Million Token. In mehreren Benchmarks konkurriert das Modell direkt mit GPT-5.5 und Claude Opus 4.7 auf vergleichbarem Niveau.

Warum DeepSeek diese Preise halten kann

Der entscheidende Faktor ist die Hardware-Strategie. DeepSeek hat V4-Pro von Anfang an für Huawei Ascend 950PR-Chips optimiert, nicht für Nvidia-GPUs.

Westliche Labore zahlen weiterhin Nvidia-H100/H200-Preise. DeepSeek umgeht diese Lieferkette. Counterpoint-Research-Analyst Wei Sun stellte fest, dass die wachsende Ascend-Produktion, mit einem angestrebten 2,5-fachen Anstieg gegenüber dem Vorjahr, der strukturelle Grund ist, warum DeepSeek diese Preise langfristig halten kann. Die MoE-Architektur verstärkt den Vorteil: Jede Inferenz aktiviert nur etwa 3% der Gesamtparameter, was die Rechenkosten pro Token deutlich senkt.

Entwicklerbindung als eigentliches Ziel

Die Strategie erinnert an AWS im Jahr 2006. Amazon bot Cloud-Computing damals zu nahezu kostendeckenden Preisen an, um Entwickler-Workflows zu gewinnen, und ließ die Wechselkosten dann die Arbeit erledigen. DeepSeek scheint dasselbe Playbook zu verfolgen. Produktionssysteme jetzt an die API binden, und später anders monetarisieren.

Ein aufschlussreiches Detail: V4-Pro unterstützt das Anthropic-API-Interface-Format. Engineers, die bereits Claude SDKs einsetzen, können bestehenden Code mit minimalen Änderungen auf DeepSeek umstellen. Die Migrationsbarriere ist bewusst niedrig gehalten.

Der Druck auf die Konkurrenz

Aktuelle Output-Preise im Vergleich:

ModellOutput pro Million Token
DeepSeek V4-Pro$0,87
Gemini 3.5 Flash$9,00
GPT-5.5ca. $30,00
Claude Opus 4.7ca. $30,00

Dieser Abstand ist schwer zu rechtfertigen, wenn allein die Kosten betrachtet werden. Westliche Labore müssen auf andere Differenzierungsmerkmale setzen: Datenschutz, Compliance, Einkaufsrichtlinien von Behörden oder Ökosystem-Lock-in. Diese Argumente existieren, werden aber schwerer, je mehr sich die Leistungslücken schließen.

Anthropic hat DeepSeek öffentlich der Destillationsattacken beschuldigt, wonach das Unternehmen Claude-Ausgaben verwendet haben soll, um eigene Modelle zu trainieren. Im März stufte die Trump-Administration Anthropic als “Lieferkettenrisiko” ein und wies Bundesbehörden an, Claude-Produkte nicht mehr zu nutzen. DeepSeeks Preisoffensive findet vor diesem geopolitischen Hintergrund statt.

Für Entwickler, die abwägen, wohin sie ihre Workloads lenken, hat sich die Rechnung diese Woche erneut verschoben. Die Frage ist nicht mehr, ob V4-Pro es wert ist, getestet zu werden. Die Frage ist, ob Compliance und Vertrauensprofil zum jeweiligen Anwendungsfall passen.

Wenn dieser Artikel hilfreich war, abonniere den Newsletter für wöchentliche KI-PM-Einblicke.


Weiterführende Artikel

Abonnieren Sie die neuesten Erkenntnisse

Abonnieren Sie den Newsletter, um meine neuesten Artikel über AI Agents in Finanzinstituten, GenAI und Architektur zu erhalten.

Kein Spam. Jederzeit kündbar.