Push-Nachrichten von MacTechNews.de

Würden Sie gerne aktuelle Nachrichten aus der Apple-Welt direkt über Push-Nachrichten erhalten?

Apple veröffentlicht Videos: KIs, die "überlegen und planen"

Wer die aktuellen Nachrichten aus Wissenschaft und Technik verfolgt, kann den Eindruck gewinnen, als drehe sich derzeit alles um KIs und Machine Learning sowie deren Integration in möglichst viele Bereiche des menschlichen Lebens. Bei den vielen Ankündigungen, Verlautbarungen und Versprechungen bleiben oftmals Fragen grundsätzlicher Natur offen. Wer sich einen Überblick verschaffen will, muss oftmals eine Menge Forschungsliteratur durcharbeiten, um mühevoll einzelne Aspekte zusammenzutragen. Alternativ besucht man eine Konferenz und hört Menschen zu, die diese Arbeit bereits hinter sich gebracht haben. Eine solche hat Apple im Juli 2025 veranstaltet – das übergreifende Thema war „Reasoning & Planning“. Nun veröffentlicht der Konzern die Mitschnitte von acht Vorträgen auf dem hauseigenen Machine-Learning-Blog.

Sieben Monate sind bei der aktuellen Taktrate von wissenschaftlichen Veröffentlichungen im Bereich von Machine Learning und Large Language Models (LLMs) eine lange Zeit. Trotzdem lohnt es sich, die im vergangenen Sommer aufgezeichneten Videos anzusehen, da sie einen Überblick über Kernaspekte der Forschung und Entwicklung liefern. So widmet sich der Vortrag von Melanie Mitchell vom Santa Fe Institute der Frage „Wie funktionieren LLMs und warum?“. Ihr Forschungsbereich liegt am Schnittpunkt zwischen Kognitionswissenschaften und KI. Sie zeigt auf, dass trotz all des Fortschritts oftmals unklar bleibt, wie LLMs zu (richtigen) Ergebnissen gelangen. So scheitern auf visuelle Aufgaben spezialisierte LLMs bei grafischen Logikaufgaben, welche für Text-LLMs (und Menschen) relativ leicht zu lösen sind.

Überraschende Beobachtung: Manche visuelle Aufgaben lassen sich leichter von Text-KIs lösen. (Quelle: Apple Machine Learning Blog)

Optimales Training für Agenten
Philipp Krähenbühl lehrt an der University of Texas und arbeitet zusätzlich als Forscher bei Apple. In seinem Vortrag widmet er sich der Frage „Wie gestaltet man effiziente Trainingsmethoden für interaktive Agenten?“. Das Ziel ist ein universelles LLM, welches beim Bewältigen komplexer Fragen hilft. In seinem Vortrag beleuchtet er aktuelle Erkenntnisse aus dem dafür notwendigen „Reinforcement Learning“.

Ein interaktiver Agent hat spezielle Anforderungen an das Design des zu Grunde liegenden LLMs. (Quelle: Apple Machine Learning Blog)

Links zu 30 Publikationen
Zusätzlich zu den acht Vorträgen von Wissenschaftlern von verschiedensten US-Universitäten sowie Apple-Entwicklern, welche allesamt unter eine halbe Stunde lang sind, listet der Blog-Beitrag zudem 30 Publikationen auf, welche bei der Veranstaltung thematisiert wurden. Apple betreibt umfangreiche Grundlagenforschung im Machine-Learning-Bereich und setzt zunehmend auf praktische Anwendung. Die aktuelle Version von Xcode erlaubt Agentic Coding mittels externer LLMs, etwa von Anthropic oder OpenAI.

Spielen auf dem MacBook Neo: 10 Titel im Test –...

macOS 26.4 erschienen

iOS/macOS 26.5 bringen mehr als 50 sicherheitsr...

Logoist 6 erschienen

Das MacBook Neo zerlegt – Überraschung beim inn...

MacBook Neo: Das sagen die Tester nach mehreren...

Mac-Tipp: Schnappschüsse anlegen und wiederhers...

Kurz: Plex "Lifetime" wird 500 Dollar teurer ++...

Kommentare

Zacks25.02.26 18:51

So spät wie Apple in den AI Bereich ein eingetreten ist kann mans auch direkt komplett sein lassen.
Wird das gleiche Disaster wie das Jahre lang dysfunktionale Siri was dem Markt hinterherhinkt.

Werd wieder Downvotes bekommen aber das bestärkt mich nur darin das ich den wunden Punkt getroffen habe.
Cook ist gut für die Shareholder aber eine absolute Innovationsbremse.

Ware wa messiah nari!

-22

iMan25.02.26 20:27

Zacks

So spät wie Apple in den AI Bereich ein eingetreten ist kann mans auch direkt komplett sein lassen.

Dir ist schon bewusst, dass Apple eigentlich mit als Erstes in diesem Bereich geforscht/entwickelt hat? Ich rede hier von neuronalen Netzen (zu der auch LLMs gehören) oder Machine Learning. Das steckt in so vielen Produkten von Apple, gerade bei Themen wie Augmented Reality. Es so darzustellen, als hätte Apple da rein gar nichts gemacht oder etwas verschlafen halte ich für irreführend.

+13

Zacks25.02.26 21:04

➞iMan
Ja, aber; mit als erstes ≠ führend.
Alleine wenn wenn man sich die absolut schlechte AI Foto Retouche Funktion anschaut, welche die schlechteste im Vergleich ist, ist es absolut egal ob Apple als erstes dabei war oder nicht.

Apple hinkt hinterher und das ist bei den Premiumpreisen einfach mehr als peinlich.
Da gibt es nichts zu verteidigen.
Apple fühlt sich in den letzten Jahren immer mehr an als währen sie ein kleines Indie Unternehmen.

Ähnlich schlimm finde ich derzeit nur Amazon, deren Alexa immer noch strohdumm ist und schon Probleme bekommt wenn Schalter/Lampen einen ähnlichen Namen haben.

Ware wa messiah nari!

-6

Frank Drebin25.02.26 21:11

Zacks

Alleine wenn wenn man sich die absolut schlechte AI Foto Retouche Funktion anschaut, welche die schlechteste im Vergleich ist, ist es absolut egal ob Apple als erstes dabei war oder nicht.

Hast du da Quellen und Beweise für deine Behauptung? Ich habe die Funktion oft im Gebrauch und die ist wirklich hervorragend wie ich finde. Und nun?

Zacks25.02.26 21:21

Reicht wenn du zum Beispiel „Apple AI Cleanup vs“ auf Youtube suchst, da gibts genug Ergebnisse und Vergleiche.
Die Mühe jetzt selbst Videos davon zu erstellen mache ich mir nicht

Ware wa messiah nari!

FreundlicherKopfsalat26.02.26 00:25

Zacks

Reicht wenn du zum Beispiel „Apple AI Cleanup vs“ auf Youtube suchst, da gibts genug Ergebnisse und Vergleiche.
Die Mühe jetzt selbst Videos davon zu erstellen mache ich mir nicht

mMn gilt hierzu Bedenken: Es geschieht on Device. Es gehen keine Daten und Bilder raus. Das sieht bei Android anders aus.

Ich kann es vor allem mit Adobe Firefly vergleichen. Ja, die sind viel besser. Aber es ist nicht lokal. Als User muss man online sein.
Keine Kontrolle über die Daten / Bilder.

Es hat alles seine Vor- und Nachteile. Oft ist auch der Lösungsweg spannend und nicht nur die Lösung. Vielleicht kann der Weg (on device, Datenschutz) dann sogar so sehr überzeugen, dass es okay ist, wenn das Ergebnis (noch) nicht perfekt ist (Retusche schlechter).

Velementov26.02.26 05:23

Erste Abbilung im Artikel mit der Bildunterschrift: „Überraschende Beobachtung: Manche visuelle Aufgaben lassen sich leichter von Text-KIs lösen.“

Kann mir jemand erklären, was es mit der Abbildung auf sich hat? Da lässt einen die Bildunterschrift im Dunkeln.

Huzzah!

KoGro26.02.26 06:51

Da war die gestellte Aufgabe, das oberste und das unterste Objekt aus dem Bild zu entfernen. Und „oben“ und „unten“ oder prinzipiell die Relation von Objekten zueinander ist etwas worauf viele (nicht alle) visuelle Modelle nicht trainiert sind. Deswegen finde ich das auch eher nicht überraschend. Visuelle Modelle sind gut darin Dinge auf einem Bild zu erkennen. Das funktioniert mittlerweile ja recht gut.
Wenn Du andererseits eine textuellen Modell die Grafik beschreibst („Ein grüner Klotz unter einem blauen unter…“) wird das evtl. eine bessere „Vorstellung“ davon haben, was „oben“ und „unten“ ist. Allerdings musst Du im Kopf behalten, dass die Talks von 2025 sind und zurückliegende Forschung beschreiben, mittlerweile würde man in der praktischen Anwendung vermutlich unterschiedliche Modelle verschränken, um solche Probleme effizient zu lösen.

Es lohnt sich aber auf alle Fälle, die Viedos anzuschauen, wenn man mehr zu den Hintergründen wissen möchte! 😉

Velementov

Krypton26.02.26 08:41

Zacks

Du wirfst einfach die Finte sehr schnell ins Korn und schätzt vielleicht die Zeitlinie der Situation extrem pessimistisch ein.

Richtig ist, Siri blieb weit hinter den ursprünglichen Erwartungen zurück. Für einige Bereiche (Anrufen, nach dem Wetter fragen, Erinnerungen, Wecker oder Timer stellen, wohin navigieren) funktioniert sie aber recht zuverlässig. Für viel mehr aber halt auch nicht.

Die Situation bezüglich AI halte ich aber für eine andere. Erstens ist man hier noch ganz am Anfang. Aktuell ist Google und ggf. Microsoft (mit OpenAI Copilot) etwas weiter, aber wir befinden uns erst auf den ersten Metern eines Marathons.
Das Problem mit Siri, Alexa, Bixbi, Cortana und wie sie alle heißen, ist die Monetarisierung. Wenn diese Services «deutlich» besser funktionieren sollen, dann kostet das immer Geld, hauptsächlich durch die Server im Hintergrund. On Device lässt sich das nur in extrem beschränktem Rahmen machen (auch noch die nächsten ~10 Jahre), daher müssen im Hintergrund immer dicke Server laufen, die in teuren Rechenzentren stehen, die Strom, Updates, Training, etc. brauchen. Und das kostet.
Aktuell arbeitet keiner der AI-Anbieter kostendeckend oder mit Gewinn. Alle pulvern Geld raus, um ein Wettrennen zu gewinnen. Daher ist hier noch gar nichts entschieden. Spannend wird es, wenn Apple die große neue Siri vorstellen wird und was sie (monatlich) kosten wird. Ggf. wird das wie Satelliten-Notruf/Messaging für die ersten 1-2 Jahre noch subventioniert und ist im Gerätepreis inbegriffen (so wie Google das macht), aber bei angenommenen Kosten von 5-25 € im Monat kann das kein Anbieter für 7-8 Jahre (Gerätelaufzeit) schon in den Verkaufspreis einrechnen. Daher wird früher oder später ein Abo dazu kommen. Dann kann man nochmal wirklich vergleichen, was die Anbieter auf Langstrecken können und was es kostet.

Apple kann hier vermutlich gut punkten, da die iPhones schon seit Jahren eine Neural-Engine eingebaut haben und im Hochpreissegment tendenziell mehr Speicher drin steckt. Daher könnten sie ggf. mehr on Device erledigen als andere Anbieter und dadurch günstiger, schneller oder beides werden. Alternativ zücken sie die Datenschutz-Karte und können damit Dinge erledigen, die andere Anbieter nur mit Preisgabe deiner Daten erledigen können. Dann wäre Apple vielleicht nur schneller und mit mehr Privatsphäre aber nicht unbedingt günstiger.

Wie dem auch sei. Das Rennen hat gerade erst begonnen und es ist ein ziemlicher Langstreckenlauf. An der Stelle schon aufzugeben oder einen Sieger ausmachen zu wollen, ist extrem zu kurz gegriffen. Dafür gibt’s dann auch Downvotes, nicht weil du irgendeinen wunden Punkt getroffen hast.

+10

Apple veröffentlicht Videos: KIs, die "überlegen und planen"

Kommentare

Kommentieren

Sie müssen sich einloggen, um die News kommentieren zu können.