Läuft die nächste Siri-Generation doch weitgehend auf Google Cloud und Nvidia-Chips?


Auf der Worldwide Developers Conference 2026, welche am 8. Juni mit der Keynote beginnt, wird Apple wohl die kommende Siri-Generation ankündigen. Für alle Nutzer wird diese voraussichtlich im Herbst zusammen mit iOS 27 zugänglich. Nun
berichtet "The Information", dass es wohl noch einige Probleme gibt, wie die immense Rechenleistung bereitgestellt werden kann. Bereits Anfang März 2026 kam ein
Bericht auf, dass Apples eigene KI-Infrastruktur für die auf Google Gemini basierende, neue Siri-Generation unzureichend sei.
So viel wie möglich lokal – doch große Modelle problematischDurch die "Apple Neural Engine", welchen A- und M-Chips verbaut ist, sind iPhones, iPads und Macs in der Lage, einige KI-Aufgaben lokal auszuführen – und das mit hoher Effizienz. Allerdings benötigen große KI-Modelle wie Google Gemini oder ChatGPT immense Speichermengen und eine lokale Berechnung ist so normalerweise nicht möglich.
Zwar gibt es einige Techniken, um Modelle in der Größe zu reduzieren und Apple selbst erwarb Firmen, welche sich genau auf diese Methodiken spezialisierten, doch für ein Modell wie Google Gemini genügen diese Herangehensweisen meist nicht mit zufriedenstellender Qualität. Aus diesem Grund werden viele Anfragen an "Siri 2.0" in Rechenzentren von leistungsstarken Servern bearbeitet und nicht lokal auf Geräten.
Apple soll sich dem Bericht nach dennoch bemühen, zumindest einige der KI-Features lokal auf dem Gerät auszuführen. So ist es denkbar, dass Apple kleinere, aus Google Gemini extrahierte und spezialisiertere Modelle für ein bestimmtes Aufgabengebiet lokal ausführt.
Google Cloud und Nvidia-KI-Chips sollen es richtenEigentlich wollte Apple wohl Google Gemini auf eigener Server-Infrastruktur, bestückt mit M2-Ultra-Chips, betreiben. Doch offenbar ist die "Private Cloud Compute" getaufte Infrastruktur nicht ausreichend, denn Apple hat laut "The Information" hier mit vielen Schwierigkeiten bezüglich der Leistung zu kämpfen.
Erst in den letzten Wochen sei die Entscheidung gefallen, doch auf "Google Cloud" wie auch auf Nvidia-KI-Beschleuniger zu setzen – und nicht auf die eigene Infrastruktur. Apple will dies weiter unter dem Namen "Private Cloud Compute" vermarkten – intern jedoch auf Nvidias "Confidential Compute" setzen, um Nutzeranfragen datenschutzfreundlich zu bearbeiten. Hier werden die Anfragen verschlüsselt entgegengenommen und bearbeitet. Dies geht laut Nvidia nur mit einem sehr moderaten Geschwindigkeitsverlust einher.