Ehemaliger Apple-Entwickler: Die Grundsteine für die Performance des M1 wurden 2010 gelegt

Apple schockte im November 2020 die Computer-Industrie: Macs mit Apple-eigenem M1-Prozessor sind nicht nur erheblich schneller als Intel-basierte PCs und Macs, sondern halten auch deutlich länger ohne Netzteil durch. In den letzten Jahren erreichte Intel von einer Prozessorgeneration zur nächsten meist einstellige oder bestenfalls niedrig-zweistellige Performance-Zuwächse. Die neuen M1-Macs sind daher eine echte Revolution: In der gesamten Computerwelt gibt es beispielsweise kein Ultrabook, welches auch nur ansatzweise bei der Performance und Akkulaufzeit mit dem aktuellen MacBook Air mithalten kann – das Preis/Leistungsverhältnis ist hier ausgezeichnet.


Doch Apple lässt sich natürlich nicht in die Karten schauen, warum die Apple-A- und M-Chips so derartig schnell und effizient sind. Shac Ron, ehemaliger Kernel-Entwickler bei Apple, widerspricht auf Twitter einer gängigen Theorie: Der M1 sei nur wegen großer Level-1-Caches so derartig schnell – dies sei Apples Trick.

Apple weit der Zeit voraus
Laut Ron wurden die Weichen bereits 2010 gestellt: Apple begann hier bereits mit der Entwicklung der 64-Bit-Umsetzung der ARM-Plattform, Jahre bevor sich andere Unternehmen für 64-Bit-Kerne in Mobilgeräten interessierten. Daher wurden Qualcomm und Samsung im Jahr 2013 auch vollständig von Apples neuem 64-Bit-Chip, dem Apple A7, und dessen überragender Performance überrascht.


Das ARM-Konsortium war zu diesem Zeitpunkt noch gar nicht mit der finalen Umsetzung eines 64-Bit-ARM-Referenzdesigns fertig, als Apple den A7 auf den Markt brachte.

Geringe Taktrate, viele Instruktionen pro Takt
Schon damals traf Apple die weitsichtige Entscheidung, die Taktraten gering zu halten, dafür aber möglichst viele Instruktionen pro Kern auszuführen – durch den Einsatz von vielen arithmetisch-logische Einheiten (ALUs) pro Kern. Dies erfordert aber, Instruktionen vorab umzusortieren und zu analysieren, um diese möglichst gut auf die verfügbaren ALUs zu verteilen. Auch führen die Apple-Chips viele Instruktionen spekulativ aus, weil der genaue Pfad durch das Programm noch nicht bekannt ist. Hat der Chip den richtigen Pfad durch den Code vorhergesagt, stehen die Ergebnisse der nächsten Instruktionen bereits fest.


ARM nicht der Grund für hohe Performance
Ron sagt weiter, dass der M1 nicht durch die ARM-Architektur so schnell sei – sondern die ARM-Architektur der Apple-Chips sei wegen weitsichtigen Entscheidungen von Apple vor einer Dekade auf diesem Niveau.

Was Ron verschweigt: Natürlich hat der M1 aktuell auch einen großen Vorteil im Vergleich zu Intel- und AMD-Chips, da dieser der erste Computer-Prozessor im 5-nm-Verfahren ist. Je geringer die Strukturbreite eines Chips, desto weniger Strom benötigt dieser für die gleiche Arbeit.

Wendepunkt in der Computer-Industrie?
Apple hat mit den eigenen Prozessoren im MacBook Air, MacBook Pro 13" und Mac mini demonstriert, was möglich ist. Die kommenden 12 bis 18 Monate werden zeigen, ob Apple es auch gelingt, bei High-End-Macs ähnliche Performance-Sprünge zu erreichen.

Glaubt man den Aussagen des gewöhnlich sehr gut informierten Mark Gurman von Bloomberg, wird die kommende Zeit sehr interessant für Mac-Anwender: Im MacBook Pro und iMac sollen 8 bis 12 Performance-Kerne zusätzlich zu vier Effizenz-Kernen werkeln – die aktuellen M1-Macs bringen vier Kerne jeder Sorte mit. Beim Mac Pro könnte Apple sogar M-Chips bis zu 32 Performance-Kernen einsetzen.

Kommentare

Scrembol
Scrembol06.01.21 08:46
Das ist schon eine sehr spannende Zeit. Ich habe mir das 2019er 16" MBP direkt im Nov '19 gekauft und bin damit superglücklich! Ich denke aber zu M2 oder M3 werde ich spätestens auch umsteigen, da die Vorteile doch sehr offensichtlich sind. Längere Akkulaufzeit bei extremem Performancezuwachs und der ganze Komfort, der mit dem Unified Memory einhergeht (beinahe sofortiges erwachen und superflüssiges UI). Ich denke, die Gefahr besteht durchaus, dass ich direkt schon den M1 16"er will, erstrecht, wenn an den MiniLED-Displaygerüchten was dran ist.

Vorher werde ich meinen Eltern noch einen M1 oder M2 MacMini ins Arbeitszimmer stellen und da ein bisschen ausprobieren wie das so für mich läuft
Mein Album WAY HOME - Eric Zobel ab sofort streamen! iTunes, YouTube, Spotify uvm.
+11
pünktchen
pünktchen06.01.21 10:38
MTN
Ron sagt weiter, dass der M1 nicht durch die ARM-Architektur so schnell sei – sondern die ARM-Architektur der Apple-Chips sei wegen weitsichtigen Entscheidungen von Apple vor einer Dekade auf diesem Niveau.

Also das ist zumindest eine missverständliche Übersetzung, es geht im Tweet um die ARM ISA, also den Befehlssatz. Den hat ARM auf Apples Wünsche hin mit der 64-Bit Version ARMv8-A angepasst. Es geht nicht um die Hardwarearchitektur der Chips, die allerdings eine passende ISA benötigte.

PS: ARMv8.3-A, ARMv8.4-A, ARMv8.6-A werden laut Wikipedia bisher anscheinend überhaupt nur von Apple benutzt.
+3
Krypton06.01.21 11:34
Doch Apple lässt sich natürlich nicht in die Karten schauen, warum die Apple-A- und M-Chips so derartig schnell und effizient sind.
Wenn sich jemand dafür interessiert und in die Karten schauen möchte, kann ich diese Folge von MacTV empfehlen. Hier erklärt der Jörn sehr anschaulich, welchen Anteil die Apple-Entwickler und welchen die ARM-Plattform generell an den schnellen M1 Prozessoren hat.
+10
der Wolfi
der Wolfi06.01.21 12:19
Krypton
Danke für den Link.
Sehr gut und anschaulich gemacht.
Normal is für die Andern
+1
martzell06.01.21 15:03
Ein ehemaliger Apple-Entwickler widerspricht, dass dies nicht nur an großen Caches liegt.

Der Apple-Entwickler meint also es läge nur an großen Caches, oder ist hier eine Verneinung zuviel?
+2
awk06.01.21 15:45
Dies erfordert aber, Instruktionen vorab umzusortieren und zu analysieren, um diese möglichst gut auf die verfügbaren ALUs zu verteilen. Auch führen die Apple-Chips viele Instruktionen spekulativ aus, weil der genaue Pfad durch das Programm noch nicht bekannt ist.

Ich hoffe Apple hat schon auf die Erkenntnisse aus Spectre und Meltdown reagiert. Die wurden erst durch spekulatives Ausführen möglich.
0
ilig
ilig06.01.21 16:03
martzell
Ein ehemaliger Apple-Entwickler widerspricht, dass dies nicht nur an großen Caches liegt.
Für mich heißt das, dass es nicht nur an dem Faktor »große Caches« sondern auch noch an anderen Faktoren liegt. Sieh Dir mal Kryptons Empfehlung an.
-1
piik
piik06.01.21 18:17
Krypton
Wenn sich jemand dafür interessiert und in die Karten schauen möchte, kann ich diese Folge von MacTV empfehlen. Hier erklärt der Jörn sehr anschaulich, welchen Anteil die Apple-Entwickler und welchen die ARM-Plattform generell an den schnellen M1 Prozessoren hat.
Ja nett gemacht, auch wenn ich dauernd über Jörns Aussprache von "cache" stolpere
+1
Weia
Weia07.01.21 09:57
ilig
martzell
Ein ehemaliger Apple-Entwickler widerspricht, dass dies nicht nur an großen Caches liegt.
Für mich heißt das,
Es gibt aber keine Privatlogik für einzelne Personen; Logik ist für alle gleich. Und dazu gehört: doppelte Verneinung = Bejahung
dass es nicht nur an dem Faktor »große Caches« sondern auch noch an anderen Faktoren liegt.
Ja, natürlich ist das gemeint, nur steht es in dem Satz eben falsch; das war alles, was martzell sagen wollte.

Korrekt wären
Ein ehemaliger Apple-Entwickler betont, dass dies nicht nur an großen Caches liegt.
oder
Ein ehemaliger Apple-Entwickler widerspricht, dass dies nicht nur an großen Caches liegt.
Not every story must end with a battle (Ophelia, in der umwerfend guten feministischen Adaption des Hamlet-Stoffes in dem Film „Ophelia“)
+1
pünktchen
pünktchen07.01.21 10:26
... widerspricht ihm und meint dass ..
0
pünktchen
pünktchen07.01.21 12:40
Krypton
Wenn sich jemand dafür interessiert und in die Karten schauen möchte, kann ich diese Folge von MacTV empfehlen. Hier erklärt der Jörn sehr anschaulich, welchen Anteil die Apple-Entwickler und welchen die ARM-Plattform generell an den schnellen M1 Prozessoren hat.

Ganz schön gemacht aber einmal scheint er mir doch ziemlichen Quatsch zu erzählen: wie kommt er bei Min 30 auf den 4 fachen "Durchsatz pro Takt" verglichen mit AMD? Woanders sehe ich Zahlen irgendwo um +60% bis +80% was ja auch schon beeindruckend ist. Aber sicher nicht +300%!

Technisch leider sonst nichts neues.
+1
Krypton07.01.21 14:04
pünktchen
Ganz schön gemacht aber einmal scheint er mir doch ziemlichen Quatsch zu erzählen: wie kommt er bei Min 30 auf den 4 fachen "Durchsatz pro Takt" verglichen mit AMD? Woanders sehe ich Zahlen irgendwo um +60% bis +80% was ja auch schon beeindruckend ist. Aber sicher nicht +300%!
Das weiß ich leider auch nicht. Eventuell gibt es einige Einzelbenchmarks, bei denen das für bestimmte Features tatsächlich der Fall ist, aber als generellen Wert kann ich mir das auch nicht vorstellen. Dann wäre der M1 bei 3,2 GHz ja viel schneller als ein Ryzen oder i5/i7 bei 4,2 - 5,2 GHz. Die 60% pro Takt scheinen mir auch realistischer und näher an der Architektur (Anzahl Decoder, Caches, INT und FPU).
Dennoch fand ich die Erklärungen sehr erhellend und auch den Blick auf die x86/x64 Architekturdetails vs ARM Architektur. Im Detail sind natürlich weitere «Ungenauigkeiten» oder Lücken. Aber so als grobe Info für den Interessierten Laien hab’ ich nichts besseres gesehen.
0
Weia
Weia07.01.21 14:55
pünktchen
... widerspricht ihm und meint dass ..
Auch richtig.
Not every story must end with a battle (Ophelia, in der umwerfend guten feministischen Adaption des Hamlet-Stoffes in dem Film „Ophelia“)
0
ilig
ilig08.01.21 13:59
Weia
Ja, natürlich ist das gemeint, nur steht es in dem Satz eben falsch; das war alles, was martzell sagen wollte.
In welchem Satz steht es falsch? Mein zitierter Satz stammt nicht aus dem Artikel sondern von martzell. Der Satz im Artikel lautet
Shac Ron, ehemaliger Kernel-Entwickler bei Apple, widerspricht auf Twitter einer gängigen Theorie: Der M1 sei nur wegen großer Level-1-Caches so derartig schnell…
Diesen Satz hat martzell selbst fehlerhaft verkürzt. Die doppelte Verneinung stammt von ihm. Du hättest es eigentlich merken und Dich an martzell wenden müssen.
0
MetallSnake
MetallSnake08.01.21 14:12
ilig
Diesen Satz hat martzell selbst fehlerhaft verkürzt. Die doppelte Verneinung stammt von ihm. Du hättest es eigentlich merken und Dich an martzell wenden müssen.

Nein, auf der Startseite (bzw. mittlerweile auf der zweiten Seite) ist der von marzell zitierte Satz so im Anreißer Text zu finden.
Die Menschheit ist eine völlig außer Kontrolle geratene Primatenspezies.
+1
ilig
ilig08.01.21 14:22
MetallSnake
Danke für Deinen Hinweis. Den Anreißer habe ich gar nicht durchgelesen – nur den eigentlichen Artikel. Dann war das also eine fehlerhafte Verkürzung von gmk.
0
Krypton08.01.21 14:34
Der Artikel wurde zwischenzeitlich geändert. Im Original war Anfangs der verwirrende Satz drin. Über den bin ich auch gestolpert.
0

Kommentieren

Sie müssen sich einloggen, um die News kommentieren zu können.