Weiterer Bericht: Die Hardware und Infrastruktur hinter Gemini-Siri – Google und Nvidia


Schon seit Monaten kursieren Berichte, wonach Apple die kommende Siri-Generation sowie bestimmte Modelle aus Apple Intelligence nicht mehr lokal oder auf hauseigenen Servern ausführen, sondern Googles Hilfe in Anspruch nehmen will. Erst vor einigen Tagen kamen wieder Meldungen über Google Cloud und Nvidia-Hardware auf. The Information hat nun noch einmal nachgelegt und die kürzlich getroffenen Aussagen präzisiert. Besagte Cloud-Anfragen sollen demnach tatsächlich auf Googles Infrastruktur mit "Nvidia Blackwell B200"-Servern laufen. Dabei wolle Apple Nvidias "Confidential Compute" nutzen, um Nutzerdaten während der Verarbeitung verschlüsselt zu halten.
Kurswechsel steht wohl anDas wäre eine deutliche Abkehr von Apples bisheriger Außendarstellung. Seit der Vorstellung von Apple Intelligence betont Apple, dass die Aufgaben direkt auf dem Gerät laufen und nur komplexere Anfragen über Private Cloud Compute verarbeitet werden – also auf Servern mit Apple Silicon und einem von Apple kontrollierten Datenschutzmodell. Allerdings dürfte jene externe Verarbeitung für neuere Modelle zukünftig eher der Standardfall sein.
Apple Infrastruktur reicht nicht ausDer Grund ist offenbar schlicht die erforderliche Rechenleistung. Apple habe intern versucht, eine angepasste Gemini-Version auf der eigenen Private-Cloud-Compute-Infrastruktur zum Laufen zu bringen. Diese Lösung sei aber zu langsam gewesen. Genau hier kamen Googles Rechenzentren mit Nvidia Blackwell B200 ins Spiel, denn diese sind für große KI-Modelle und speziell auf Training und Inferenz großer Sprachmodelle ausgelegt.
Notlösung: Ein sonst ungeliebtes VorgehenDamit würde Apple im Hintergrund genau jene Architektur verwenden, die das Unternehmen sonst eigentlich gerne vermeidet. Fremde Modelle auf fremder Cloud mit fremden Beschleunigern für eine Schlüsselfunktion des Systems. Was technisch durchaus nachvollziehbar ist, bleibt in der Kommunikation dennoch heikel. Auch zeitliche Aspekte dürften eine Rolle gespielt haben, denn noch ein bis zwei Jahre Verspätung würden erst recht seltsam aussehen.
Datenschutz per Nvidia-FunktionenNvidias Confidential Compute könnte der Versuch sein, den Widerspruch zwischen der 2024er Darstellung ("lokal, wegen Datenschutz") und den kolportierten Plänen abzufedern. Die Verarbeitung findet in einer geschützten Umgebung statt, sodass der Cloud-Betreiber keinen Einblick in die unverschlüsselten Daten erhält. Wie es aber ebenfalls schon mehrfach hieß: Langfristig würde Apple sehr gerne alles in der eigenen Hand haben, die Google-Lösung ist demnach für eine (vermutlich mehrjährige) Übergangsphase geplant.