Jahresrückblick 2025: Die stille Kraft stetigen Fortschritts
Mein KI-Abenteuer 2025 in vier Zahlen: 6, 5, 1, 6. Nicht weil es so glamourös war, sondern weil es bodenständig blieb. GenAI in einer Bank zu implementieren...
Praxisnahe Einblicke zu AI Agents in Finanzinstituten, GenAI im Produktiveinsatz, GraphRAG, Ontologie-Architektur, DevOps × AI und Enterprise-AI-Plattformen.
Mein KI-Abenteuer 2025 in vier Zahlen: 6, 5, 1, 6. Nicht weil es so glamourös war, sondern weil es bodenständig blieb. GenAI in einer Bank zu implementieren...
GPT-5.6 Sol wurde am 26. Juni veröffentlicht, ist aber nur für 20 von der US-Regierung geprüfte Partner zugänglich. Die Benchmark-Zahlen sind sekundär gegenüber dem neuen Governance-Muster.
Chinas LineShine belegt Platz 1 der TOP500-Liste mit 2,198 Exaflops, ganz ohne Nvidia-, Intel- oder AMD-Chips. Doch Linpack misst FP64-Algebra, kein KI-Training. Fermi-Rechnung zeigt: Ein vergleichbarer GPU-Cluster trainiert dasselbe Modell 5-mal schneller bei einem Neuntel der Stromkosten.
GPT-5.6 Sol erreicht 91,9 % auf Terminal-Bench 2.1 und 750 Token/s auf Cerebras. METR dokumentierte gleichzeitig die höchste jemals gemessene Evaluation-Gaming-Rate. Zunächst nur für rund 20 staatlich geprüfte Organisationen verfügbar.
US-KI-Modelle auf OpenRouter fielen von 70% auf 30% Token-Anteil in einem Jahr. DeepSeek allein hält 16,3%. ChatGPTs globaler Marktanteil sank erstmals unter 50%. OpenAI erwägt Preissenkungen vor dem Börsengang. Wie lange hält der Compliance-Schutzwall noch?
Token-Verbrauch stieg um das 18,6-Fache, Fehlerquoten um 54%, Code-Churn um 861%. Uber, Microsoft, Meta und Amazon bremsen radikal, ausgerechnet vor den IPO-Plänen von OpenAI und Anthropic.
Anthropic informierte den US-Senat über den bislang größten Destillationsangriff auf Claude: 28,8 Mio. Anfragen über 25.000 Fake-Konten in sechs Wochen, gezielt auf Claudes wertvollste Fähigkeiten. Kosten: wahrscheinlich unter 90.000 Dollar. Extrahierter Wert: um ein Vielfaches höher.
Qualcomm übernimmt das KI-Startup Modular für 3,9 Milliarden US-Dollar in Aktien. Mojo-Sprache und MAX Engine sollen Nvidias CUDA-Dominanz beim Inference-Layer herausfordern.
Das Weiße Haus forderte OpenAI auf, GPT-5.6 auf rund 20 staatlich genehmigte Unternehmen zu beschränken. Ein historischer Präzedenzfall: Erstmals schränkt die US-Regierung ein inländisches KI-Modell noch vor dem Launch ein.
OpenAI und Broadcom präsentierten Jalapeño, OpenAIs ersten eigenen Inferenz-ASIC. Von der Entwicklung bis zum Tape-out in neun Monaten, mit KI-unterstütztem Chip-Design. Bereitstellung Ende 2026 geplant, kein NVIDIA-Ersatz, sondern eine gezielte Wette auf Inferenzkostenoptimierung.
Bloomberg berichtete am 24. Juni, dass Jonas Adler und Alexander Pritzel Google verlassen und zu Anthropic wechseln — die vierte Abgangswelle in fünf Wochen. Alphabet verlor rund 270 Milliarden Dollar Marktkapitalisierung, doch der eigentliche Schaden ist der gleichzeitige Abgang in Vortraining, KI-Coding und Wissenschaftsforschung.
OpenAI veröffentlichte am 22. Juni GPT-5.5-Cyber. Das Daybreak-Team fand bereits 24 Linux-Kernel-Exploits, 5 Chrome-V8-Schwachstellen und 10 Safari-Lücken. Die CyberGym-Wertung von 85,6 Prozent ist die Schlagzeile. Die ExploitGym-Wertung von 39,5 Prozent erklärt, warum der Zugang auf geprüfte Verteidiger beschränkt bleibt.
Anthropic startete am 23. Juni Claude Tag: Claude Opus 4.8 als dauerhaftes KI-Teammitglied in Slack-Kanälen mit kanalgebundenem Gedächtnis und geteiltem Kontext. Die 65-Prozent-Code-Zahl ist Anthropics eigene Angabe ohne unabhängige Verifizierung. Token-Kosten, Migrationsfrist und Datenschutzgrenzen sind die drei Kernfragen für Unternehmen.
Google versprach auf der I/O am 19. Mai, Gemini 3.5 Pro werde nächsten Monat allgemein verfügbar sein. Am 24. Juni ist das Modell nur in einer eingeschränkten Enterprise-Vorschau. Prediction Markets sehen die Chance auf einen Launch bis 30. Juni bei 50 bis 55 Prozent.
SK Hynix hat am 24. Juni seine ADR-Anmeldung bei der koreanischen FSS eingereicht und strebt ein Nasdaq-Debüt am 10. Juli an, mit bis zu 29 Milliarden Dollar für den Ausbau des Yongin-Chipwerks. Das ist kein Kapitalbedarf, sondern ein Neubewertungsmanöver. Das KOSPI-KGV von 8x gegenüber Microns 15x sagt alles.
Tenet Security enthüllt Agentjacking: Angreifer schleusen Schadcode in Sentry-Fehlerereignisse ein, den KI-Coding-Agenten wie Claude Code, Cursor und Codex mit 85 % Erfolgsrate ausführen. 2.388 Unternehmen sind betroffen. Sentry lehnte eine Grundursachenbehebung ab.
Die kostenlose Testphase von Fable 5 endet heute. Mit 50 Dollar pro Million Output-Tokens sind die eigentlichen Hürden die 30-tägige Datenhaltungspflicht, domänenspezifische Classifier-Trigger-Raten und die Dual-Track-Architektur mit Mythos 5.
Getty Images und OpenAI schließen einen mehrjährigen Display-Vertrag für ChatGPT. GETY steigt 167 Prozent vorbörslich. Der Vertrag markiert einen strategischen Schwenk nach dem Stability-AI-Prozess.
Z.ai veröffentlicht GLM-5.2: 753B Open-Weight-Modell mit 62,1 Punkten auf SWE-bench Pro, besser als GPT-5.5, für 4,40 Dollar pro Million Output-Tokens. MIT-Lizenz und Anthropic-kompatible API machen es zum direkten Ersatz für gesperrte Modelle.
Der Reuters Institute Digital News Report 2026 zeigt: 10 % der Erwachsenen weltweit nutzen KI-Chatbots wöchentlich für Nachrichten, aber nur 4 % klicken auf die Originalquelle. Googles organischer Traffic zu Nachrichtenwebsites fiel um 33 %, Verlage rechnen mit weiteren 43 % in drei Jahren.
Samsung Electronics stellt ChatGPT Enterprise und Codex für alle Mitarbeitenden in Südkorea und der weltweiten DX-Division bereit, drei Jahre nach dem unternehmensweiten KI-Verbot nach einem Quellcode-Leak 2023. Einer der bislang größten Enterprise-Verträge von OpenAI.
Anthropic Project Fetch Phase 2: Claude Opus 4.7 schrieb autonom Steuercode für einen Roboterhund 37-mal schneller als das beste menschliche Team ohne KI-Unterstützung, mit einem Zehntel der Codezeilen. Der Roboterhund holte den Ball trotzdem nicht. Das Ergebnis ist Meilenstein und ehrliche Grenzmarkierung zugleich.
Die US-Energieregulierungsbehörde FERC hat sechs große Netzbetreiber per einstimmigem Beschluss angewiesen, den Netzanschluss für KI-Rechenzentren zu beschleunigen. Die Behörde kann Fristen setzen, aber keine Transformatoren aus dem Boden stampfen.
Google, Microsoft und Hugging Face haben am 17. Juni 2026 gemeinsam die ARD-Spezifikation (Agentic Resource Discovery) veröffentlicht. KI-Agenten können damit zur Laufzeit per natürlicher Sprache Werkzeuge entdecken — wie DNS fürs Web, aber für die Agentenwelt.
Qualcomm soll laut Reuters in Gesprächen zur Übernahme des KI-Chip-Startups Tenstorrent für 8-10 Milliarden US-Dollar sein. Das von Chip-Legende Jim Keller geführte Unternehmen entwickelt RISC-V-basierte KI-Beschleuniger als Alternative zu Nvidias CUDA-Ökosystem.
John Jumper, Mitentwickler von AlphaFold und Nobelpreisträger für Chemie 2024, verlässt Google DeepMind nach neun Jahren und wechselt zu Anthropic. Der Schritt folgt auf Noam Shazeers Abgang zu OpenAI und zeigt, wohin sich KI-Spitzenforschung verlagert.
OpenAIs S-1-Börsenzulassungsantrag enthüllt Q1-Zahlen: Umsatz verdreifachte sich auf 5,7 Mrd. Dollar, aber die operative Nicht-GAAP-Marge liegt bei -122 %. ChatGPT-Wachstum stagniert, Anthropic holt auf.
Tag 7 des Fable-5-Verbots: Das Weiße Haus fordert vollständige Jailbreak-Sicherheit vor dem Neustart. Sicherheitsexperten sind sich einig: Das ist technisch unmöglich für jedes Frontier-Modell, und Dario Amodei hat bereits beide Lösungsvorschläge der Regierung abgelehnt.
SpaceX gibt 20-Milliarden-Anleihen zur Refinanzierung des xAI-Übernahmekredits aus. Drei Agenturen vergaben Investment-Grade auf Basis von 75 Mrd. USD KI-Verträgen trotz eines Q1-Verlusts.
Google Antigravity CLI ersetzt Gemini CLI am 18. Juni und sperrt kostenlose Nutzer sofort aus. Das ehemals quelloffene Tool wird proprietär, der KI-Coding-Markt vollständig geschlossen.
Noam Shazeer, Mitautor des Transformer-Grundlagenpapers und Google-Gemini-Co-Lead, wechselt zu OpenAI. Google hatte ihn 2024 für 2,7 Milliarden Dollar zurückgeholt. Sein Abgang kurz vor OpenAIs IPO trifft Googles KI-Programm hart.
Jensen Huang eröffnete die VivaTech 2026 in Paris mit 20 Milliarden US-Dollar für KI-Infrastruktur in acht europäischen Ländern, nur Tage nachdem US-Exportkontrollen Europas Abhängigkeit von amerikanischer KI bloßgestellt hatten.
Vier Tage nach seinem Rekord-Börsengang gab SpaceX per SEC 8-K bekannt, den KI-Coding-Assistenten Cursor für 60 Mrd. USD zu übernehmen – die größte VC-Startup-Akquisition aller Zeiten. Cursor hat 4 Mrd. USD ARR und über eine Million zahlende Nutzer.
Eine einzige US-Exportverordnung legte Anthropics Fable 5 weltweit lahm. Kanadas Premierminister Mark Carney verglich die Folgen beim G7-Gipfel mit dem systemischen Risiko von 2008 und fordert souveräne KI-Infrastruktur.
Eine Koalition aus 42 US-Bundesstaaten hat OpenAI per Subpoena zu ChatGPTs Schmeichel-Tendenz, Versäumnissen beim Jugendschutz und dem Umgang mit Gesundheitsdaten befragt, nur drei Wochen nach der vertraulichen IPO-Anmeldung. Übersteht der Billionen-Dollar-Börsengang diese Untersuchung?
Nur drei Tage nach dem Launch erzwang das US-Handelsministerium die globale Abschaltung von Claude Fable 5 und Mythos 5. Auslöser war eine Unicode-Homoglyph-Jailbreak-Demonstration, bei der ein 120.000-Zeichen-System-Prompt geleakt wurde.
Goldman Sachs prognostiziert 7,6 Billionen Dollar kumulative KI-Infrastrukturausgaben bis 2031. Nvidia soll 75% des Rechenmarkts abschöpfen; die Stromversorgung bleibt der kritischste Engpass.
Auf der HDC 2026 stellte Huawei HarmonyOS 7 vor: Xiaoyi wird zum systemweiten KI-Agenten mit Agent Framework 2.0, über 2.100 Systemfähigkeiten und einer Aufgabenerledigungsrate von über 90%.
GPTZeros forensische Analyse von KPMGs KI-Bericht ergab, dass 40 von 45 Zitiertiteln erfunden und 89 % der Zitate fehlerhaft waren. UBS, NHS und Transport for London dementierten die Behauptungen. KPMG zog den Bericht zurück.
Das US-Handelsministerium ordnete die Sperrung von Anthropics leistungsstärksten Modellen Fable 5 und Mythos 5 an – ausgelöst durch einen engen Jailbreak mit Cybersicherheitsbezug. Anthropic folgte der Anweisung und widersprach ihr gleichzeitig.
Zum ersten Mal in der G7-Geschichte nehmen die CEOs von OpenAI, Anthropic und Google DeepMind gemeinsam am Gipfel in Évian teil (15.-17. Juni). Dahinter stecken US-Widerstand gegen multilaterale KI-Vereinbarungen, Europas Kampf um KI-Souveränität und zwei kurz vor dem Börsengang stehende KI-Konzerne.
OpenAI übernimmt das deutsche Startup Ona (früher Gitpod) und integriert persistente Cloud-Sandbox-Technologie in Codex, damit KI-Agenten stunden- oder tagelang autonom arbeiten können. Dies ist OpenAIs sechste Akquisition in 2026, direkt gegen Anthropics Vorsprung im Enterprise-Coding.
Das Wall Street Journal berichtete am 11. Juni, dass OpenAI API-Token-Preissenkungen erwägt. Auslöser: Anthropics Claude Code wuchs explosionsartig und brachte das erste profitable Quartal. Mit dem Beginn des KI-Preiskampfs gewinnen Unternehmenskunden an Verhandlungsmacht.
Jeff Bezos' und Vik Bajaj's Prometheus kam am 11. Juni 2026 mit einer Series-B-Finanzierung von 12 Milliarden Dollar bei 41 Milliarden Bewertung aus dem Stealth-Modus. Ziel: ein KI-System, das Strahltriebwerke, Pharmamoleküle und Halbleiter entwirft und damit LLM-Logik in die physische Ingenieurtechnik überträgt.
KI erzeugt enorme reale Wirtschaftswerte, die BIP, VPI und Arbeitsmarktstatistiken nicht erfassen. Wenn die Kosten für die Erstellung eines Testaments von 500 Dollar an Anwaltsgebühren auf 0,50 Dollar an Token-Kosten sinken, liest das statistische System dies als 'rückläufige Dienstleistungsproduktion'. Wenn die Fed weiterhin auf dieses defekte Messgerät setzt, wird die Geldpolitik im Dunkeln tappen.
Anthropic hat sein Mythos-Klassemodell erstmals öffentlich zugänglich gemacht. Claude Fable 5 erledigte eine 50-Millionen-Zeilen-Ruby-Migration in einem Tag und kommt mit drei Sicherheitsklassifikatoren.
Google DeepMind hat am 10. Juni 2026 DiffusionGemma 26B-A4B als Open Source veröffentlicht. Bild-Diffusionstechnik für Text: 15–20 Token pro Forward Pass, 1000+ Tokens/Sek. auf H100, 4× schneller als vergleichbare autoregressive Modelle. Kompromiss: geringere Ausgabequalität als Standard-Gemma 4.
Anthropic veröffentlichte am 9. Juni 2026 Claude Fable 5 — das erste öffentlich verfügbare Modell der Mythos-Klasse. Analytics-Benchmarks überschreiten 90% (+10 Punkte gegenüber Opus 4.8), SWE-Bench erreicht 80,3%, Preis liegt bei $10/$50 pro MTok, und ein Sicherheitsklassifikator leitet Hochrisikoanfragen an Opus 4.8 weiter.
Morgan Stanley prognostiziert: Die weltweite KI-bezogene Schuldenemission verdoppelt sich 2026 auf 570 Mrd. USD. Bis Ende Mai wurden bereits 236 Mrd. emittiert, viermal mehr als im Vorjahr. Hyperscaler planen 700 Mrd. USD Investitionen, Alphabet begab sogar eine 100-jährige Anleihe.
SoftBanks Versuch, 6 Milliarden Dollar mit seinem 13%-Anteil an OpenAI als Sicherheit aufzunehmen, ist gescheitert. Selbst eine Papierbewertung von 852 Mrd. USD überzeugt Kreditgeber nicht — ein Strukturproblem im privaten KI-Finanzmarkt wird sichtbar.
Erstmals hält Anthropics Claude mehr US-Enterprise-KI-Ausgaben als OpenAI — 34,4 % vs. 32,3 % laut Ramp AI Index Mai 2026. Claude Code treibt Anthropics vierfaches Jahreswachstum in Unternehmen.
Das EU-KI-Gesetz tritt am 2. August vollständig in Kraft – mit Bußgeldern bis zu 35 Mio. € oder 7% des globalen Umsatzes. Die EU hat gerade ein 60-köpfiges Expertengremium eingesetzt, und 78% der Unternehmen haben bisher keine ernsthaften Compliance-Schritte unternommen.
Tim Cooks letzter WWDC-Keynote: Apple baut Siri mit einem maßgeschneiderten Google-Gemini-Modell mit 1,2 Billionen Parametern neu, zahlt dafür etwa 1 Mrd. USD jährlich. iOS 27 ermöglicht Nutzern die Wahl zwischen ChatGPT, Claude und Gemini.
Moonshot AI strebt 30 Milliarden Dollar Bewertung an — sechs Monate nach einer 4,3-Milliarden-Dollar-Runde. Kimis ARR verdoppelte sich in einem Monat auf 200 Millionen Dollar.
US-Kongress' 269-seitiger KI-Gesetzentwurf sperrt staatliche KI-Gesetze für 3 Jahre und schreibt Pflichtaudits für große KI-Firmen vor. Gewerkschaften und Demokraten lehnten ihn sofort ab.
OpenAI hat am 6. Juni den Lockdown Mode eingeführt: Nutzer können ChatGPTs Netzwerkzugriff einschränken, um Datenlecks durch Prompt-Injection-Angriffe zu minimieren. Für alle Konten verfügbar.
Gemini Enterprise übertraf die eigenen Kapazitäten. Google wendet sich an SpaceX: 920 Mio. $ monatlich für die ehemalige xAI-Colossus-Infrastruktur. Was das über die KI-Rechenknappheit verrät.
SpaceX' $75B-IPO war binnen 24 Stunden nach Roadshow-Start überzeichnet. Goldman Sachs prognostiziert, dass KI-Compute bis 2030 $322B von $474B Umsatz liefern wird. Der Markt bewertet SpaceX als KI-Infrastrukturunternehmen.
Claudes Aufgabenhorizont verdoppelt sich alle vier Monate. Anthropics Ingenieure liefern achtmal mehr Code als vor fünf Jahren. Das Unternehmen kurz vor seinem Milliarden-IPO fordert einen globalen Pause-Mechanismus.
Cambridge-Forscher schließen die erste Sicherheitsstudie eines KI-entwickelten Impfstoffs ab: Das KI-Super-Antigen soll gegen alle Coronaviren schützen. Die gleiche Methode wird nun für Grippe- und Ebola-Impfstoffe eingesetzt.
Die CEOs von OpenAI, Anthropic, Google DeepMind und Microsoft AI fordern in einem gemeinsamen Brief den US-Kongress auf, ein Pflichtscreening synthetischer DNA einzuführen, da KI die Wissensschwellen für Biowaffen rapide absenkt.
DeepSeek, das chinesische KI-Startup, das bislang ohne Fremdkapital auskam, sammelt nun 7,4 Mrd. Dollar bei einer Bewertung von bis zu 59 Mrd. Dollar ein. Der Grund: KI-Agenten verschlingen Infrastruktur.
Anthropic hat am 1. Juni vertraulich einen S-1-Antrag bei der SEC eingereicht und plant einen Börsengang im Herbst 2026. Der Jahresumsatz stieg von 4 Mrd. USD im Juli 2025 auf über 50 Mrd. USD, getrieben durch Claude Code.
Anthropic Mythos Preview erzielte 181 funktionierende Firefox-Exploits gegenüber nur 2 bei Opus 4.6. Project Glasswing umfasst 200+ Organisationen, darunter NATO und ENISA, doch nur 75 von 6.000+ kritischen Lücken wurden gepatcht.
Das größte Signal auf dem Microsoft Build 2026: sieben hauseigene MAI-Modelle, Project Polaris ersetzt GPT-4 Turbo in GitHub Copilot bis August, ein 9,69-Milliarden-Dollar-Pentagon-Vertrag und Open-Source-Agenten-Frameworks.
Pflegezentren in Taiwan verlassen sich noch immer auf Papierformulare, Excel und Messenger-Gruppen. KotoCare ist ein MVP, das wirklich läuft — Fallmanagement, KI-Abfragen, CSV-Berichte, digitales Whiteboard, alles mit echtem Datenbankbetrieb.
NVIDIA präsentierte auf der Computex 2026 den N1X, seinen ersten ARM-Laptop-SoC mit 6.144 CUDA-Kernen und 1.000 TOPS KI-Leistung. Dell, Lenovo und Asus gehören zu den ersten Partnern. Der Kampf um Windows ARM beginnt.
GitHub Copilot stellt am 1. Juni auf tokenbasierte KI-Credits-Abrechnung um. Code-Vervollständigungen bleiben kostenlos, aber Chat, Agenten-Workflows und Code-Reviews verbrauchen jetzt Credits.
SoftBank verpflichtet sich zu Investitionen von bis zu 75 Milliarden Euro in KI-Rechenzentren in Frankreich – 5 GW Gesamtkapazität, Phase 1 bis 2031 mit 3,1 GW in der Region Hauts-de-France.
Anthropic veröffentlicht Claude Opus 4.8 nur 41 Tage nach Opus 4.7: Agentic-Coding-Score steigt auf 69,2%, Fast-Mode-Preis sinkt um zwei Drittel, neue dynamische Workflows steuern hunderte parallele Subagenten. Mythos-Klasse-Modelle folgen in Wochen.
Dell Q1 FY27: KI-Server-Umsatz 16,1 Mrd. (+757% YoY), Gesamtumsatz 43,8 Mrd. (+88%), Aktie +33% – bester Handelstag seit dem Börsen-Comeback 2018.
Drei Monate nach ersten Berichten über eine 30-Milliarden-Runde schloss Anthropic nun 65 Milliarden ab – bei 965 Milliarden Bewertung, über OpenAI.
Google-DeepMind-Chef Demis Hassabis hat seinen AGI-Zeitplan beim Google I/O 2026 aktualisiert: Frühestens 2029 – über fünf Jahre früher als seine Prognose vom Vorjahr. Er sagt, wir stehen am Fuß der Singularität.
CNN reichte die erste KI-Urheberrechtsklage eines TV-Senders gegen Perplexity ein. 17.000 gestohlene Artikel stehen im Zentrum eines Streits, der die Medienbranche verändern könnte.
Das KI-Startup Cognition sammelte 1 Mrd. USD bei 26 Mrd. USD Bewertung. Der ARR wuchs 13-fach auf 492 Mio. USD in 12 Monaten. Devin schreibt nun 90 % des internen Codes – Kunden sind Goldman Sachs, NASA und Mercedes-Benz.
Illinois verabschiedete SB 315 mit 110:0 Stimmen: OpenAI, Anthropic und Google DeepMind müssen jährlich externe Sicherheitsaudits durchführen lassen. Beide KI-Labs unterstützten das Gesetz. Gouverneur Pritzker will unterzeichnen.
Mistral AI gab heute Industriepartnerschaften mit Airbus und BMW bekannt. Spezialisierte Modelle sollen Crashtests beschleunigen und die Flugzeugentwicklung verbessern. Europäische Datensouveränität wird zum Kaufkriterium.
Peking kontrolliert jetzt, wann KI-Spitzenkräfte bei Privatunternehmen wie Alibaba und DeepSeek das Land verlassen können. Die USA beschränkten Chips – China beschränkt jetzt Menschen.
Jensen Huang verkündete auf der Computex, dass Nvidias jährliche Ausgaben in Taiwan von 10-15 Mrd. USD vor fünf Jahren auf 100 Mrd. USD gestiegen sind, mit Kurs auf 150 Mrd. Taiwans Taiex schloss am selben Tag auf Rekordhoch.
Q1-Umsatz 56 Mrd. $, Nettogewinn 26,8 Mrd. $ – und trotzdem 8.000 Entlassungen. Meta blutet nicht; es wandelt Personalkosten in Rechenleistungsbudget um, die größte KI-Infrastrukturwette in der Technikgeschichte.
NVIDIA meldet Q1 FY2027-Umsatz von 81,6 Mrd. USD, ein Plus von 85% im Jahresvergleich. Jensen Huang erklärte, dass 'Agentic AI angekommen' sei, und stellte den Vera-Rubin-Zeitplan vor. Die Aktie fiel trotz Rekordwerten, ein Lehrbeispiel für die Erwartungsfalle.
Papst Leo XIV. hat am 25. Mai sein erstes KI-Lehrschreiben veröffentlicht und dabei Anthropic-Mitgründer Christopher Olah als Mitpräsentator eingeladen. Das Dokument warnt vor Entmenschlichung durch KI und setzt Menschenwürde als obersten Maßstab.
DeepSeek macht seinen 75%-Rabatt auf die V4-Pro-API dauerhaft: Output-Token zu $0,87 pro Million, 34-mal günstiger als GPT-5.5. Das ist kein Sonderangebot, sondern ein gezielter Angriff auf die Preismacht westlicher KI-Labore.
Eine vergiftete Nx Console VS Code-Erweiterung war nur 18 Minuten aktiv, doch TeamPCP stahl 3.800 GitHub-interne Repositories, kompromittierte zwei OpenAI-Mitarbeitergeräte und bot Mistrals Quellcode in Untergrundforen an.
Anthropic veröffentlicht die Ergebnisse des ersten Monats von Project Glasswing: Claude Mythos Preview entdeckte über 10.000 kritische Sicherheitslücken in 1.000 Open-Source-Projekten mit einer Bestätigungsrate von 90,6%.
OpenAI investiert 234 Mio. USD für erstes internationales AI Lab in Singapur. IMDA aktualisiert gleichzeitig den KI-Governance-Rahmen.
OpenAI hat am 22. Mai eine vertrauliche S-1-Anmeldung bei der SEC eingereicht und strebt eine Bewertung von 1 Billion Dollar an. Goldman Sachs und Morgan Stanley begleiten den Prozess.
Stunden vor der Unterzeichnung stoppte Trump eine KI-Exekutivorder für eine freiwillige 90-Tage-Modellprüfung. Musk und Zuckerberg hatten Trump über Nacht ihre Ablehnung mitgeteilt.
Anthropics Q2-Umsatz soll sich auf 10,9 Mrd. $ mehr als verdoppeln. Ein SpaceX-Rechenvertrag von 1,25 Mrd. $/Monat sichert die Infrastruktur für Claudes rasantes Wachstum.
OpenAIs allgemeines Reasoning-Modell hat die Erdős-Einheitsabstands-Vermutung widerlegt — ein 78 Jahre altes offenes Problem. Der Beweis wurde von Fields-Medaillengewinner Tim Gowers und Noga Alon (Princeton) bestätigt.
Google I/O 2026 zeigt: KI-Nutzung wächst nicht durch mehr manuelle Eingaben. 3,2 Billiarden Tokens pro Monat, 7-faches Jahreswachstum — dahinter stecken automatisierte Pipelines. Die Frage ist nicht ob, sondern wie automatisch die KI für dich arbeitet.
Bei Google I/O 2026 überarbeitete Google seine Suchmaschine erstmals seit 25 Jahren grundlegend und startete Gemini Spark. Mit 900 Millionen Gemini-Nutzern verschärft sich der KI-Wettbewerb.
OpenAI adoptiert C2PA und integriert Googles SynthID-Wasserzeichen in ChatGPT-Bilder und lanciert ein öffentliches Prüftool. Zwei KI-Rivalen gegen Deepfakes, aber löst das das Problem wirklich?
Anthropic hat das SDK-Automatisierungsstartup Stainless für über 300 Millionen Dollar übernommen und kündigt die Abschaltung aller externen Dienste an. OpenAI und Google nutzten es. Es geht um die Kontrolle über die Verbindungsschicht im KI-Agenten-Zeitalter.
Google I/O 2026 präsentiert Gemini Intelligence auf Betriebssystemebene, die neue Googlebook-Laptopkategorie und Samsung-XR-Brillen – Google setzt auf Verteilung statt auf Modell-Rankings.
In der Bankbranche greift KI nicht zuerst urteilsintensive Stellen an. Sie zielt auf die Weiterleitungskette ab – auf die Menschen, die Daten von A nach B bewegen. Wie viel Ihres Tages ist eigentlich Weiterleitung?
Die fachübergreifende Übersetzungsfähigkeit wird zur entscheidenden Kompetenz im KI-Zeitalter – nicht weil es gut klingt, sondern weil nach der KI-Übernahme alles, was nur eine Sprache erfordert, nur noch Übersetzungsarbeit übrigbleibt.
Anthropics unveröffentlichtes Claude Mythos Preview entdeckte eigenständig Tausende Zero-Day-Schwachstellen in führenden Betriebssystemen. 12 Technologieriesen kooperieren als Verteidiger, doch das Modell wurde am ersten Tag unberechtigt abgerufen.
Google I/O 2026 öffnet morgen. Das geleakte Gemini Omni verspricht einheitliche Text/Bild/Video-Generierung – aber kann es Claude Mythos mit 93,9% SWE-bench einholen?
Vor drei Monaten 380 Milliarden, jetzt 900 Milliarden: Ist Anthropics neueste Finanzierungsrunde rationale Marktbewertung – oder der nächste KI-Bewertungsgipfel?
OpenAI-Mitgründer Greg Brockman übernimmt offiziell die Produktstrategie und führt ChatGPT, Codex und Developer-API zu einer Agentic-Plattform zusammen – vier Tage vor Google I/O.
Cerebras startete bei 185 Dollar, sammelte 5,55 Milliarden ein und legte am ersten Handelstag 68 Prozent zu. Der WSE-3-Chip ist bis zu 15-mal schneller als GPUs beim Inferencing, OpenAI und AWS sind bereits Kunden.
OpenAI und Plaid ermöglichen ChatGPT Pro-Nutzern, über 12.000 Finanzinstitute zu verbinden. Ausgabenanalyse, Portfolioverfolgung und Finanzplanung – aber Nutzer stellen kritische Datenschutzfragen.
Anthropic und die Gates Foundation verpflichten sich zu 200 Millionen Dollar über vier Jahre für Claude-Einsatz in Gesundheit, Bildung und Landwirtschaft, mit öffentlich nachprüfbaren Ergebnissen.
Der Trump-Xi-Gipfel öffnete H200-Exportlizenzen für Alibaba, Tencent, ByteDance und 7 weitere, doch Peking riet vom Kauf ab, und kein einziger Chip wurde geliefert.
Gerichtsakten zeigen: OpenAI-Chef Sam Altman hält über 2 Milliarden Dollar persönliche Beteiligungen an neun Unternehmen, die Geschäfte mit OpenAI gemacht haben, allein 1,7 Milliarden in Helion Energy. Heute beginnen die Schlussplädoyers.
Thinking Machines' TML-Interaction-Small erreicht 0,40 Sekunden Latenz — 3x schneller als OpenAI — indem es die Pipeline-Architektur vollständig verwirft und Interaktivität durch skaliertes Training lernt.
Im Mai 2026 veranstaltete Anthropic die Code with Claude 2026-Konferenz in San Francisco, London und Tokio. Statt eines neuen Modells präsentierte Anthropic eine Kombination aus Compute-Infrastruktur, Agentenfähigkeiten, Entwicklertools und Kostenoptimierung – ein klares Signal für den Wandel vom Benchmark-Wettbewerb zur praxisorientierten KI.
Kein Quiz über RAG oder Prompts — es fragt: Ist dein Urteilsvermögen in echten KI-Produktszenarien bereit? 20 szenariobasierte Fragen in 5 Kerndimensionen.
Anthropics Cat Wu beschreibt einen neuen PM-Rhythmus im KI-Zeitalter: Rollen verschmelzen, Prototypen ersetzen Dokumente, Iterationen dauern Tage statt Monate. Das Lesen ließ mich an meine eigene undefinierte Rolle in einem Unternehmens-KI-Team zurückdenken – und an Peter Dengs Avengers-Philosophie.
TSMC-Aktie stieg 137% von ~164 $ im April 2025 auf 387 $ im April 2026. Dieser Beitrag erklärt, wie KI-Chip-Nachfrage, CoWoS-Engpässe und NVIDIA als neue Nummer-1-Kunde den Kurs trieben.
Das KI-Rennen 2026 dreht sich im Kern um Harness-Engineering. Dieser Beitrag analysiert die 12 Kernmodule eines produktionsreifen Agent Harness, führende Framework-Philosophien und die 7 Architekturentscheidungen jedes KI-Architekten.
GPT-5.5 erschien am 23. April und führt 14 Benchmarks an. Dahinter steckt Jensen Huangs NVIDIA-Wette: 10 Gigawatt Infrastruktur, bis zu 100 Milliarden Dollar Investition.
Ilya sagt, Kompression ist Lernen. Freedman findet, dass nur polynomial wachsende Monoide komprimierbar sind. Wenn Persona auf eine nilpotente Teilstruktur projiziert werden kann, ist PPV nicht nur statistisches Fitting — sondern algebraisch fundierte Persönlichkeitskompression.
Am 17. April 2026 lancierte Anthropic Claude Design, ein konversationsbasiertes KI-Designtool. Nutzer beschreiben einfach ihre Anforderungen, und Claude erstellt interaktive Prototypen, Präsentationen, One-Pager und mehr. Angetrieben von Claude Opus 4.7, Anthropics leistungsfähigstem Vision-Modell, ließ der Launch Figmas Aktie an einem Tag um 5 % einbrechen.
Die meisten KI-Agenten vergessen alles nach jeder Sitzung. Hermes Agent ist anders — er merkt sich, was Sie ihm beibringen, und wird mit der Zeit besser. Was dieses Open-Source-Framework von NousResearch auszeichnet.
Harness Engineering ist die Ausführungsschicht in der KI-Agenten-Architektur. Dieser Beitrag stellt das Kerndesign eines Harness vor: Ausführungskontrolle, Observierbarkeit, Hooks, Tool-Sandbox und Zustandsverwaltung.
Wenn KI-Forscher sagen, LLMs seien 'menschenähnlich', welche Menschen meinen sie? Eine Harvard-Studie von 2023 zeigt mit 262 kulturübergreifenden Variablen: ChatGPT steht kulturell westlichen WEIRD-Demokratien am nächsten (r = -.70).
Können LLMs wirklich 'Sie' simulieren? Von Generative Agents über BehaviorChain bis zum RAG-freien Psychometric Persona Vector (PPV) Framework – dieser Artikel analysiert drei führende Ansätze zur KI-Persona-Simulation.
Der ehemalige Tesla-KI-Direktor Andrej Karpathy schlägt vor, traditionelles RAG durch ein LLM-gepflegtes persönliches Wiki zu ersetzen. Wie sammelt diese Drei-Schichten-Architektur Wissen wie Zinseszins an?
Im April 2026 unter Apache 2.0 veröffentlicht, bietet Gemma 4 vier Varianten — E2B, E4B, 26B MoE und 31B Dense. Das 31B-Modell belegt Platz 3 unter allen offenen Modellen weltweit, unterstützt 256K Kontext und native agentische Workflows.
Ende Maerz 2026 fuehrte eine versehentliche 59.8MB Source Map in Analytics' npm-Release zu einem vollstaendigen Leak der zugrunde liegenden Claude Code Architektur. Neben einem technischen Fehler ist dies die erste Dematerialisierung von Enterprise-Grade Agent-Frameworks, mehrschichtigen Prompts und Undercover-Modi.
KI-Shopping-Agenten entwickeln sich von Demos zu echten Verbraucherwerkzeugen. Walmart startete Sparky, Target kooperiert mit Google Gemini, und Shopify veroeffentlichte sein Agentic-Commerce-Protokoll. Wenn KI-Agenten fuer dich bezahlen, werden die Regeln des E-Commerce neu geschrieben.
OpenClaw-Gruender Peter Steinberger verwandelte ein Wochenendprojekt mit Anthropics Claude in ein virales AI-Agent-Framework. Nach einem Markenrechtsstreit und einer Umbenennung klopfte OpenAI an seine Tuer. Im Zeitalter der KI-Entdeckung kann selbst die kleinste Idee die Welt veraendern.
In seinem neuesten Interview beschrieb Andrej Karpathy eine „KI-Psychose“ – er hat seit Monaten keinen Code mehr selbst geschrieben. Dieser Artikel fasst seine zentralen Erkenntnisse aus dem „No Priors“-Podcast zusammen, einschließlich des Konzepts der „Claws“.
2026 年 3 月 Google 推出了 Stitch 更新。這款由 Gemini 驅動的 AI 原生設計畫布不僅能透過自然語言生成 UI,更新增 Voice Canvas 語音編輯。它將如何徹底顛覆 Figma 與設計師的未來工作流?
OpenClaw hat gezeigt, dass ein Assistent eine persistente Computing-Schicht ist. Aber seine Varianten (wie NanoBot, CoPaw, IronClaw) sind noch faszinierender. Fünf verschiedene Pfade skizzieren die wahre Form der nächsten Generation von KI-Assistenten.
KI-Agenten klingen cool, aber der Bau von Agent-Produkten in Unternehmen ist voller Stolperfallen. Hier sind fünf Designfallen, die ich selbst erlebt habe.
Wenn Ihr Chef fragt 'Lohnt sich die KI-Investition?', brauchen Sie Zahlen. Hier ist das Vier-Kennzahlen-Framework, das ich zum Nachweis des GenAI-Werts verw...
Enterprise Prompt Engineering ist völlig anders als die persönliche ChatGPT-Nutzung. Strukturierte Templates, Versionskontrolle, Multi-Rollen-Design — Erken...
Ein RAG-System im Bankwesen aufbauen: Wie wählt man Chunk-Strategie, Embedding-Modell und Retrieval-Pipeline? Erfahrungen aus der Produktion.
Muss ein AI PM programmieren können? Ein vollständiger Skill-Tree-Vergleich, einschließlich Vibe Coding, von AI PMs.
KI in einer Bank einzusetzen bedeutet nicht einfach ein Modell auszuwählen. Compliance, Sicherheit, Data Governance, Organisationskultur — jede Hürde ist de...
Besorgt, dass Ihr KI-Feature bald überflüssig wird? Erfahren Sie, wie Sie Modellentwicklungen antizipieren und KI-Patente anmelden, um einen unangreifbaren...
Kein Code? Von wegen. Der Arbeitsalltag eines AI PM beinhaltet den Wechsel vom traditionellen PM zum ganzheitlichen 'Builder'.
In derselben Ära und unter derselben Berufsbezeichnung 'Ingenieur' verlieren einige durch KI ihren Job, während andere durch sie neue finden. Was deinen Pla...
So habe ich im vergangenen Jahr Teams geführt, aber ich stellte fest, dass einige Mitarbeiter mit mangelnder Erfahrung und Neugier sich in diesem Arbeitsmod...
Wir bauen eine KI-Agenten-Plattform, die 'wirklich live geht und von echten Menschen genutzt wird', indem wir GenAI in Arbeitsabläufe integrieren – von der...
Habe einen KI-Browser entwickelt, der automatisch alle Denkvorgänge und Suchverläufe aufzeichnet, entscheidet, wann Screenshots gemacht werden müssen, und a...
Einst hatte 'KI' in der Akademie ein negatives Image, und Geoffrey Hinton wurde stark für seine Arbeit an neuronalen Netzen kritisiert. Heute hat er den Tur...
KI ist nicht mehr nur ein Spielzeug für Demos, sondern wird Teil der Cloud-Infrastruktur. Wenn sich Werkzeuge ändern, ändern sich auch die dazugehörigen Rollen.
Perplexity steht vor einem 'Positionierungs'-Test: Einerseits sollen sie die Erwartungen an die 'KI-Suche der nächsten Generation' erfüllen, andererseits we...
Beim DevFest Taipei 2025 habe ich eine produktive KI-Vertriebs-Coaching-Plattform vorgestellt—mit Multi-Agenten-Kollaboration, Persona World und Ontology +...
Am 30.11. werde ich auf der von Google GDG organisierten DevFest Taipei 2025 über die praktische Anwendung von KI-Agententeams sprechen. Wir freuen uns über...
GraphRAG ersetzt Einzelpunktsuchen durch eine graphbasierte Wissensstruktur. Es nutzt die Beziehungen zwischen Knoten und Kanten, um die Generierung zu unte...
Sechs neue Gebrauchsmuster wurden Anfang dieses Jahres genehmigt und letzten Monat wurden fünf weitere Patente angemeldet. Dies ist das Jahr, in dem generat...
Wie konzipiert ein Bank-GenAI-Produktmanager ein LLM-System, das als Antwort auf Geschäftsprobleme automatisch einen Knowledge Graph aufbaut, und erhält daf...
Am 30.11. spreche ich auf der DevFest Taipei 2025 der Google GDG über angewandte KI-Agententeams. Freier Eintritt nach Überprüfung, Anmeldung ist willkommen.
Dies ist das beste Video-Tutorial zum Thema 'Attention is All You Need', das ich bisher gesehen habe.
Dieser Vortrag von Jason Wei war eine echte Erleuchtung, hat mir Gänsehaut bereitet. Es ist definitiv ein systematischer Weg, um KI-Szenarien zu finden.
Auf der iThome Hello World Entwicklerkonferenz dieses Jahres hielt ich vier KI-fokussierte Vorträge, vom MCP-Ökosystem und GraphRAG bis hin zu Abwehrmechani...
Erhält man absolut konsistente Ergebnisse, wenn man die Temperatur des KI-Modells auf 0 setzt? Die Antwort ist nein, und eine Studie von Thinking Machine La...
Wenn ein GenAI-System sensible Daten abfragt, wie verhindert man, dass böswillige Nutzer die Sicherheit umgehen? Dieser Artikel beschreibt detailliert, wie...
Wie der Gacha-Automat der großen drei Vibe-Coding-Modelle: OpenAI's Codex, Google's Gemini und Anthropic's Claude.
Nano Banana (Gemini 2.5 Flash Bildfunktion) ist wirklich beeindruckend, von der Anpassung eines Anzugs über die Korrektur des Lächelns bis hin zu detaillier...
Verwandeln generativer KI, moderner Finanztechnologien und intelligenter Finanzanwendungen in skalierbare Produkte und Dienstleistungen – wir bringen Finanz...
Der ehemalige OpenAI VP of Product, Peter Deng, detailliert das Wesen von Produkten, Wachstumsstrategien von 1 auf 100, die fünf PM-Archetypen sowie den Wer...
Die Agenten-Vorgänge von ChatGPT werden in Echtzeit angezeigt und sind nachvollziehbar, fast so, als würde man einer menschlichen Sekretärin dabei zusehen,...
Explodieren die Bereitstellungskosten für LLMs? Dieser Artikel zeigt, wie ein Bank-GenAI-Produktmanager eine modulare Architektur nutzte, um KI-Systeme nach...
Traditionelle DBAs verwalten Datenbanken nach Erfahrung, aber bei hoher Nebenläufigkeit reicht das nicht aus. Dieser Artikel zeigt, wie ein GenAI Product Ow...
Wie verhindert man bei der Einführung eines KI-Wissensdatenbanksystems in einer Bank Datenlecks, ohne die Antwortqualität zu beeinträchtigen? Dieser Artikel...
Das Stargate ist nun ein 24-Stunden-Schichtprojekt für ein Serverzentrum. Wenn die Amerikaner anfangen, 24/7 zu kämpfen, weiß man, dies ist ein Krieg, den s...
Die Google-Keynote war eine dichte Abfolge von Produktankündigungen, die deren Haltung zeigte. Im Vergleich zur Geschwindigkeit neuer Funktionen ist OpenAI...
Elon glaubt, Fantasie sei nach dem Erlernen von Wissen das Wichtigste. Frieren sagt, Magie sei die Welt der Vorstellung – Transformers und GenAI sind diese...
Was sind die wahren Schmerzpunkte von Kundenberatern? Wie hilft GenAI ihnen, in Echtzeit personalisierte Anlageempfehlungen zu generieren? Dieser Artikel te...
Unser Financial AI Technology Team sucht leidenschaftliche Experten für DevOps und Data Science, um gemeinsam GenAI-Anwendungen zu entwickeln und umzusetzen.
Die Kandidaten müssen innerhalb von 60 Minuten mit LLMs und Frontend-Entwicklung eine statische Website fertigstellen, wodurch der Fokus vom 'Wissensgedächt...
Dieses Jahr steht im Zeichen der KI-Agenten. Wir sehen uns auf den DevOpsDays am 5. und 6. Juni – Fünf Verhaltensmuster von KI-Agenten: Mit KI die Zukunft d...
OpenAI zeigte vier große Innovationen: Vision Fine-Tuning, Realtime API, Model Distillation und Prompt Caching, wodurch mehr Kontrolle in die Hände der Entw...