Push-Nachrichten von MacTechNews.de

Würden Sie gerne aktuelle Nachrichten aus der Apple-Welt direkt über Push-Nachrichten erhalten?

Weiterer Bericht: Die Hardware und Infrastruktur hinter Gemini-Siri – Google und Nvidia

Schon seit Monaten kursieren Berichte, wonach Apple die kommende Siri-Generation sowie bestimmte Modelle aus Apple Intelligence nicht mehr lokal oder auf hauseigenen Servern ausführen, sondern Googles Hilfe in Anspruch nehmen will. Erst vor einigen Tagen kamen wieder Meldungen über Google Cloud und Nvidia-Hardware auf. The Information hat nun noch einmal nachgelegt und die kürzlich getroffenen Aussagen präzisiert. Besagte Cloud-Anfragen sollen demnach tatsächlich auf Googles Infrastruktur mit "Nvidia Blackwell B200"-Servern laufen. Dabei wolle Apple Nvidias "Confidential Compute" nutzen, um Nutzerdaten während der Verarbeitung verschlüsselt zu halten.

Kurswechsel steht wohl an
Das wäre eine deutliche Abkehr von Apples bisheriger Außendarstellung. Seit der Vorstellung von Apple Intelligence betont Apple, dass die Aufgaben direkt auf dem Gerät laufen und nur komplexere Anfragen über Private Cloud Compute verarbeitet werden – also auf Servern mit Apple Silicon und einem von Apple kontrollierten Datenschutzmodell. Allerdings dürfte jene externe Verarbeitung für neuere Modelle zukünftig eher der Standardfall sein.

Apple Infrastruktur reicht nicht aus
Der Grund ist offenbar schlicht die erforderliche Rechenleistung. Apple habe intern versucht, eine angepasste Gemini-Version auf der eigenen Private-Cloud-Compute-Infrastruktur zum Laufen zu bringen. Diese Lösung sei aber zu langsam gewesen. Genau hier kamen Googles Rechenzentren mit Nvidia Blackwell B200 ins Spiel, denn diese sind für große KI-Modelle und speziell auf Training und Inferenz großer Sprachmodelle ausgelegt.

Notlösung: Ein sonst ungeliebtes Vorgehen
Damit würde Apple im Hintergrund genau jene Architektur verwenden, die das Unternehmen sonst eigentlich gerne vermeidet. Fremde Modelle auf fremder Cloud mit fremden Beschleunigern für eine Schlüsselfunktion des Systems. Was technisch durchaus nachvollziehbar ist, bleibt in der Kommunikation dennoch heikel. Auch zeitliche Aspekte dürften eine Rolle gespielt haben, denn noch ein bis zwei Jahre Verspätung würden erst recht seltsam aussehen.

Datenschutz per Nvidia-Funktionen
Nvidias Confidential Compute könnte der Versuch sein, den Widerspruch zwischen der 2024er Darstellung ("lokal, wegen Datenschutz") und den kolportierten Plänen abzufedern. Die Verarbeitung findet in einer geschützten Umgebung statt, sodass der Cloud-Betreiber keinen Einblick in die unverschlüsselten Daten erhält. Wie es aber ebenfalls schon mehrfach hieß: Langfristig würde Apple sehr gerne alles in der eigenen Hand haben, die Google-Lösung ist demnach für eine (vermutlich mehrjährige) Übergangsphase geplant.

Ugreen 240W USB-C

Cook auf Ternus: Wie viel Macht hat ein Apple-C...

Zuverlässigkeit und Defekte: Intel- vs. M-MacBo...

OpenAI startet GPT-5.6 – nach (politischen) Ver...

Apple erklärt: Warum Siri AI nicht in der EU ko...

iOS 27: Zahlreiche weitere Detailverbesserungen

Mac-Tipp: Wie viele Monitore unterstützt der Ma...

Video: So entstehen iPhone-Akkus

Kommentare

OliBerlin05.06.26 12:05

Ich hätte gerne eine lokale KI, die ohne Cloudzugriff und auch offline auf dem Mac arbeitet und dadurch etwas vertrauenswürdiger ist. Dieser würde ich dann anvertrauen, meine sämtlichen Dokumente zu analysieren und durchsuchbar zu machen. Auf dieser Basis möchte ich Fragen stellen wie „Wann ist die nächste Autoversicherung fällig?“ oder „Wie war mein Verbleib mit John Appleseed?“

Solch eine lokale Verarbeitung auf dem Gerät wäre nicht abhängig von Funkverbindungen und sollte auch international akzeptiert werden.

Wenn Apple dagegen Online-Dienste von Google oder NVDIA einkaufen und zu denen Daten übertragen sollte, egal wieviel Sicherheit versprochen wird, dann bleiben Zweifel und die strengen Anforderungen in der EU und in China werden damit kaum erfüllt. Es sei denn, es werden in den verschiedenen Regionen unterschiedliche KIs eingebaut, aber dann entstände Chaos.

Gambler05.06.26 12:09

Gemma 4?

OliverCGN05.06.26 12:09

OliBerlin

Hast Du Dir schon mal LM Studio oder AnythingLLM angesehen? Das ist genau das, was Du suchst. Gerade AnythingLLM ist dafür entwickelt worden, mit Deinen Dokumenten zu chatten.

In dem Zusammenhang ist DEVONthink auch interessant. Das ist eine lokale Dokumentenverwaltung, die eine Schnittstelle für lokale LLM bietet. (Mit einem Kauf würde ich zunächst abwarten, da es in den letzen Jahren immer einen Summersale mit guten Rabatten gab.)

Califa05.06.26 13:04

OliverCGN

Hast Du Dir schon mal LM Studio oder AnythingLLM angesehen? Das ist genau das, was Du suchst. Gerade AnythingLLM ist dafür entwickelt worden, mit Deinen Dokumenten zu chatten.

Für sowas braucht man wahrscheinlich einen ziemlich potenten Mac, oder? Kennt sich da jemand mit aus?

M1kRR05.06.26 13:57

Wenn die Apple KI dann auf Google Servern und Software läuft, ist Siri für mich endgültig tot.

-1

Tommy198005.06.26 14:19

M1kRR

Wenn die Apple KI dann auf Google Servern und Software läuft, ist Siri für mich endgültig tot.

Ist auch heute für mich nicht mehr als eine Eieruhr.

Brunhilde_von_der_Leyen05.06.26 15:17

Califa

Für sowas braucht man wahrscheinlich einen ziemlich potenten Mac, oder? Kennt sich da jemand mit aus?

Kommt drauf an. Die Größe des LLM. Wie schnell möchtest Du Antworten haben, welche Antworten erwartest du. Etc. Das könnte Dir Chat GTP genauer beantworten Auf jeden Fall gibt es LLMs die nicht riesig sind, damit sie (in der Windows Welt wichtig) auch komplett in den GPU Speicher geladen werden können.

Signaturen – das digitale Äquivalent zum Gartenzwerg

iBims05.06.26 15:18

Califa

OliverCGN

Hast Du Dir schon mal LM Studio oder AnythingLLM angesehen? Das ist genau das, was Du suchst. Gerade AnythingLLM ist dafür entwickelt worden, mit Deinen Dokumenten zu chatten.

Für sowas braucht man wahrscheinlich einen ziemlich potenten Mac, oder? Kennt sich da jemand mit aus?

Es kommt sehr drauf an welches LLM und was du erreichen möchtest. Z.B habe ich eine Webapp für mich entwickelt, welche über LM Studio und dem LLM "Qwen3 Coder 30B A3B Instruct" webseiten für mich analysiert und dann die nötigen Infos extrahiert und speichert. Das funktioniert sehr sehr gut. Aber oftmals ist es auf nicht so leistungsstarken Mac Computer dann langsam bei t/s (token pro Sekunde). Das heisst bis es dann mal die Antwort ausgegeben hat oder auch nur schon deine Anfrage verstanden hat, kann es je nach LLM Sekunden bis einige Minuten dauern.

OliverCGN08.06.26 13:25

Califa

OliverCGN

Hast Du Dir schon mal LM Studio oder AnythingLLM angesehen? Das ist genau das, was Du suchst. Gerade AnythingLLM ist dafür entwickelt worden, mit Deinen Dokumenten zu chatten.

Für sowas braucht man wahrscheinlich einen ziemlich potenten Mac, oder? Kennt sich da jemand mit aus?

Nicht wirklich: Hier geht es um Sprachverständnis, das ist auch mit kleinen LLM. realisierbar. Jeder Mac mit einem M-Prozessor ist da völlig ausreichend. Vorteilhaft ist möglichst viel RAM. Vorteilhaft sind mindestens 32 GB. Es läuft aber auch schon mit 16 GB.

Für generative KI sollte man mehr RAM haben - aber ich habe festgestellt, dass selbst ein Mac mit 128 GB da nur bedingt gut funktioniert.

Weiterer Bericht: Die Hardware und Infrastruktur hinter Gemini-Siri – Google und Nvidia

Kommentare

Kommentieren

Sie müssen sich einloggen, um die News kommentieren zu können.