← Zurück zu Einblicke

Qualcomms 3,9-Milliarden-Wette auf Modular: Der CUDA-Angriff setzt auf den Inference-Layer

Nils Liu
Qualcomm Modular CUDA AI Chips Inference Mojo Nvidia Acquisition

Kurzfassung

Qualcomm übernimmt das KI-Startup Modular für 3,9 Milliarden US-Dollar in Aktien. Mojo-Sprache und MAX Engine sollen Nvidias CUDA-Dominanz beim Inference-Layer herausfordern.

Qualcomms 3,9-Milliarden-Wette auf Modular: Der CUDA-Angriff setzt auf den Inference-Layer

Eine Frage zu Beginn: Hast du jemals konkret berechnet, was eine Migration von CUDA auf einen alternativen Stack kosten wurde? Nicht theoretisch, sondern tatsachlich: Engineering-Stunden, Performance-Abweichungen, Kompatibilitätsprobleme mit bestehenden Tools. Wer diese Kalkulation gemacht hat und zu einem anderen Ergebnis kommt als die übliche Einschätzung, findet hier Daten zum Abgleich.

Was dieser Deal bedeutet

Am 24. Juni 2026 gab Qualcomm bekannt, Modular Inc. für rund 3,92 Milliarden US-Dollar in Aktien zu übernehmen, 19,2 Millionen Qualcomm-Aktien für den gesamten Unternehmenswert.

Modular wurde 2022 von Chris Lattner gegründet, dem ursprünglichen Autor der LLVM-Compiler-Infrastruktur, dem Designer von Apples Swift-Sprache und früheren Engineering-Lead bei Tesla Autopilot und Google. Das Unternehmen hat zwei Kernprodukte: Mojo, eine Programmiersprache mit Python-kompatibler Syntax und systemnahen Performance-Eigenschaften, und MAX Engine, eine Laufzeitumgebung für die Inferenz, die CUDA, ROCm und Apple Metal aus einer einzigen Codebasis ansprechen kann, ohne auf Nvidias Vendor-Bibliotheken angewiesen zu sein.

Laut Bloomberg war Modulars letzte Finanzierungsrunde im September 2025: 250 Millionen US-Dollar bei einer Bewertung von 1,6 Milliarden. Der Kaufpreis von 3,92 Milliarden entspricht einem Aufschlag von 150 Prozent und einer 2,4-fachen Wertsteigerung in neun Monaten. Qualcomm-CEO Cristiano Amon: “Die Zukunft gehört entwicklerfreundlichen, horizontalen Plattformen, die auf verschiedenen Compute-Umgebungen laufen.” Chris Lattner: “Qualcomm gibt uns die Reichweite, um unsere Mission zu beschleunigen.”

Was die Zahlen tatsächlich aussagen

3,92 Milliarden US-Dollar fur ein Unternehmen mit 150 Mitarbeitern: rund 26 Millionen pro Person. Dieser Preis zeigt klar, Qualcomm kauft hier technologische IP und strategische Positionierung, kein Personalkapital.

Im Kontext von Qualcomms Grosse: Das Unternehmen erzielt pro Quartal rund 11 Milliarden US-Dollar Umsatz. Die Akquisition entspricht etwa vier Monaten Einnahmen. Die Aktien-Zahlung schont den Cashbestand, die Verwasserung durch 19,2 Millionen Aktien ist aber real.

Die entscheidende Frage zum CUDA-Burggraben: Nicht ob MAX Engine Modelle auf verschiedener Hardware ausfuhren kann, das kann sie nachweislich. Sondern was ein CUDA-Wechsel tatsachlich kostet. CUDA hat rund vier Millionen registrierte Entwickler und zwei Jahrzehnte handoptimierter Kernel-Bibliotheken. Jede Alternative erbt diese installierte Basis als Reibung.

MAX Engine adressiert heute primär die Inferenz, nicht das Training. Das ist der richtige Einstiegspunkt. Die Abhangigkeit von CUDA auf der Trainingsseite bleibt mittelfristig bestehen. Inferenz ist ein anderes Kapitel. Der Grossteil des KI-Compute-Aufwands bei Skalierung liegt heute nicht im Training, sondern im Serving von Milliarden taglicher Anfragen. In diesem Kontext ist Performance-pro-Watt wichtiger als rohe GPU-Rechenleistung. Qualcomm hat eine Dekade Erfahrung mit Edge-NPUs in Snapdragon-Chips, und dieser Ansatz lasst sich auf Rechenzentren ubertragen.

Der verifizierbare Test dieser These: Innerhalb von sechs Monaten sollte mindestens ein grosser Hyperscaler offentlich uber Produktions-Inferenz auf Qualcomm-Silicon mit MAX berichten, mit einem Cost-per-Token-Ruckgang von mindestens 30 Prozent gegenuber vergleichbaren H100-Workloads. Ohne diesen Datenpunkt bleibt die Akquisition in der Integrationsphase.

Ein weiterer Punkt verdient Aufmerksamkeit: Lattner hat mit LLVM bewiesen, dass gute Compiler-Infrastruktur die Wettbewerbsdynamik eines gesamten Hardware-Okosystems verandern kann. AMDs ROCm hat zehn Jahre versucht, den Abstand zu CUDA zu schliessen; Compiler-Qualitat ist ein wesentlicher Grund fur das Scheitern. Lattner hat jetzt die Chance, mit Qualcomms Hardware-Reichweite von Grund auf neu anzusetzen.

Warum Qualcomm jetzt handelt

Der Rechenzentrums-KI-Markt war bis 2025 praktisch Nvidias unkontestiertes Territorium. Die Lieferengpasse bei H100 haben AWS, Microsoft und Google dazu gebracht, Alternativen zu evaluieren, was die Bereitschaft des Marktes fur Nicht-CUDA-Stacks beschleunigte.

Qualcomm setzt auf zwei Seiten gleichzeitig: weiterentwickelte KI-Chips auf der Hardware-Seite und MAX zur Reduzierung der Entwickler-Wechselkosten auf der Software-Seite. Das offizielle Qualcomm-Pressemitteilung beschreibt das Ziel als Starkung einer vollstandigen KI-Deployment-Kette vom Edge bis zum Rechenzentrum. Mit einem laufenden Tenstorrent-Deal hat Qualcomms KI-Infrastruktur-Gesamtinvestition die 14-Milliarden-Grenze uberschritten.

Das ist eine Strategie, Edge-Vorteile in die Cloud zu ubertragen, kein Frontangriff gegen Nvidia aus dem Nichts.

Was man beobachten sollte

Technisch: Mojos GitHub-Stern-Wachstum und Produktions-Deployment-Fallstudien. Der Schwellenwert, der zahlt, ist ob ein Mainstream-KI-Framework MAX innerhalb von zwolf Monaten als unterstutztes Backend einfuhrt. Ohne das stagniert die Plattformstrategie.

Kommerziell: Qualcomms Rechenzentrum-Kundengewinne. Ihr aktueller KI-Chip-Umsatz stammt primär aus Edge-Geraten. Ein Inferenz-Vertrag mit einem Hyperscaler validiert die Rechenzentrum-These. Ankündigungen sind fur Q4 2026 oder Q1 2027 zu erwarten.

Regulatorisch: Der Deal soll in H2 2026 abgeschlossen werden. Beide Unternehmen sind in den USA ansassig, was das Kartellrisiko begrenzt, aber eine All-Stock-Transaktion erfordert Aktionarzustimmung. Qualcomms aktuelle Kursentwicklung ist eine zusatzliche Variable.

Wenn dieser Artikel hilfreich war, abonniere den Newsletter fur wochentliche KI-PM-Einblicke.

Abonnieren Sie die neuesten Erkenntnisse

Abonnieren Sie den Newsletter, um meine neuesten Artikel über AI Agents in Finanzinstituten, GenAI und Architektur zu erhalten.

Kein Spam. Jederzeit kündbar.