Push-Nachrichten von MacTechNews.de
Würden Sie gerne aktuelle Nachrichten aus der Apple-Welt direkt über Push-Nachrichten erhalten?

Mac Studio mit M3 Ultra: Leistungshungriges KI-Modell DeepSeek R1 läuft vollständig lokal

Mit der Einführung des M3 Ultra-Chips unterstreicht Apple einmal mehr die eigene Innovationsstärke im Bereich Hochleistungsprozessoren. Zahlreiche Praxistests belegen, dass der M3 Ultra in vielen Bereichen absolute Spitzenwerte liefert. In einem ausführlichen Video zeigt der YouTuber Dave2D, dass der Mac Studio mit M3 Ultra sogar in der Lage ist, das anspruchsvolle KI-Modell DeepSeek R1 mit 671 Milliarden Parametern lokal auszuführen.


Technische Voraussetzungen
Um das DeepSeek R1-Modell in vollem Umfang nutzen zu können, ist eine erhebliche Menge an Arbeitsspeicher erforderlich. Der Mac Studio mit M3 Ultra kann mit bis zu 512 GB Unified Memory konfiguriert werden und genau das ist die RAM-Konfiguration, welche für die lokale Ausführung des KI-Modells benötigt wird. Während des Tests verbrauchte das Modell 404 GB Arbeitsspeicher und erforderte die manuelle Zuweisung von 448 GB Video-RAM über Terminal-Befehle.


Vorteile der lokalen Ausführung
Die Möglichkeit, solch fortschrittliche KI-Modelle lokal auszuführen, bietet erhebliche Vorteile, insbesondere im Hinblick auf den Datenschutz. In sensiblen Bereichen wie der Gesundheitsdatenanalyse oder im Finanzwesen können Daten vor Ort verarbeitet werden, ohne sie an Cloud-Dienste senden zu müssen, was das Risiko von Sicherheitslücken minimiert.

Kein Schnäppchen
Diese Leistung hat ihren Preis: Ein Mac Studio mit M3 Ultra Chip, 32-Core CPU, 80-Core GPU, 32-Core Neural Engine und 512 GB RAM kostet 11.874,00 €. Wer das Maximum herausholen möchte, zahlt für die Vollausstattung stolze 17.624,00 €. Für Unternehmen, die sensible Daten lokal mit KI verarbeiten müssen, stellt der Mac Studio dennoch eine vergleichsweise preisgünstige Lösung dar – insbesondere im Vergleich zu anderen Workstation-Optionen.

Exzellente Energieeffizienz
Ein weiterer bemerkenswerter Aspekt des M3 Ultra ist seine Energieeffizienz. Trotz der hohen Rechenleistung liegt der Stromverbrauch des Mac Studio während der Ausführung des DeepSeek R1 Modells unter 200 Watt. Im Vergleich dazu würden herkömmliche PC-Hardwarelösungen mit mehreren GPUs etwa das Zehnfache an Energie benötigen, um eine vergleichbare Leistung zu erzielen.

Kommentare

westmeier
westmeier18.03.25 18:36
Für einen Laien für mich sind das schon beeindruckende Zahlen.
+12
Nebula
Nebula18.03.25 18:48
Ist das 671B-Q4-Modell eigentlich wirklich das, was auch die App und die Website nutzt? 4-Bit-Quantisierung ist ja schon echt mikrig.
»Wir waren schon immer schamlos darin, großartige Ideen zu stehlen.« – Steve Jobs
-17
gfhfkgfhfk18.03.25 20:55
westmeier
Für einen Laien für mich sind das schon beeindruckende Zahlen.
Es fehlen die Vergleiche mit anderen Produkten, um beurteilen zu können wie gut oder schlecht der M3Ultra in Vergleich zu anderen AI Plattformen ist. Die Speichergröße alleine ist nicht sonderlich aussagekräftig, denn sie lässt nur Rückschlüsse zu über die maximale Größe der Modelle. Aber wie viele Tokens schaft der M3Ultra dann im Vergleich zu anderer Hardware? Und wie sieht das in Relation zum Kaufpreis und Stromverbrauch aus?
+6
Frost19.03.25 00:36
gfhfkgfhfk
Aber wie viele Tokens schaft der M3Ultra dann im Vergleich zu anderer Hardware?

Zu genau diesem Punkt hatte Jensen Huang auf der heutigen GTC Keynote ein interesantes Chart gezeigt. Dort konnt man sehen, dass NVIDA den Sweetspot bei der Konfiguration so einstellt, dass das Modell ca. 220 Token pro Sekunde ausgibt.
Das wuerden dann fuer die meisten Nutzer eine responsive Erfahrung des Modells hervorrufen.
Bei 220 Tokens pro Sekunde kann ein 100MW AI Datacenter dann 50.000.000 Tokens pro Sekunde / 220 Tokens pro Sekunde ~230.000 Nutzer parallel bedienen. Das konnte man auf dem Chart auch ganz gut herauslesen.
+2
hakken
hakken19.03.25 09:25
Bei Bitsundso wurde gestern gesagt das es um 11 Token bei 2 von den Teilen geht, was in etwa so leistungsfähig ist wie ne spezialisierte DOSe für 6k.
0
Gedankenschweif19.03.25 09:46
hakken
Bei Bitsundso wurde gestern gesagt das es um 11 Token bei 2 von den Teilen geht, was in etwa so leistungsfähig ist wie ne spezialisierte DOSe für 6k.
Diese Dose hat aber keine 512 GB Grafikspeicher und kann somit das hier besprochene LLM nicht verarbeiten.
0
gfhfkgfhfk19.03.25 09:47
Ich habe dieses Video im Netz gefunden, wo die neuen nVidia Produkte auch mit Apples Systemen verglichen werden.
0
hakken
hakken19.03.25 09:53
Gedankenschweif

Doch, selbstverständlich. Darum geht es ja. AFAIK nutzt die Kiste einfach den RAM dafür.



0
gfhfkgfhfk19.03.25 10:38
hakken
Doch, selbstverständlich. Darum geht es ja. AFAIK nutzt die Kiste einfach den RAM dafür.
Nein, Du hast Gedankenschweif nicht verstanden die „DOSe“ sprich x86 System mit Grafikkarte verfügt nicht über soviel GPU Speicher.
+1
svenski19.03.25 10:52
gfhfkgfhfk
Ich habe dieses Video im Netz gefunden, wo die neuen nVidia Produkte auch mit Apples Systemen verglichen werden.

Ein Link wäre schön...🙄

Gruß, svenski.
-2
gfhfkgfhfk19.03.25 10:58
svenski
Ein Link wäre schön...🙄
???
Auf „dieses Video“ klicken, wie das bei HTML üblich ist. Man muss in der Foren Software nicht das verwenden.
+1
Nebula
Nebula19.03.25 13:35
Wie gibt man solche Links ein?
»Wir waren schon immer schamlos darin, großartige Ideen zu stehlen.« – Steve Jobs
0
gfhfkgfhfk19.03.25 15:48
Nebula
Wie gibt man solche Links ein?
Erst den Tag den man mit den @Button oben einfügt, dann der Text und anschließend den schließenden Tag mit /url anstatt url= wie beim Öffnenden.
0
Nebula
Nebula19.03.25 18:15
Mal schauen, ob ich's kapiert habe. Hübsche lokale Bild-KI.

Und zum direkten nachvollziehen:
[url=https://url.tld]Linkname[/url]

Edit: Juhu, klappt. Vielen Dank.
»Wir waren schon immer schamlos darin, großartige Ideen zu stehlen.« – Steve Jobs
+1

Kommentieren

Sie müssen sich einloggen, um die News kommentieren zu können.