Push-Nachrichten von MacTechNews.de
Würden Sie gerne aktuelle Nachrichten aus der Apple-Welt direkt über Push-Nachrichten erhalten?

Apple will per Statistiken zeigen: Apple Intelligence zunehmend auf Augenhöhe

Mit einiger Verzögerung fanden die auf der letztjährigen WWDC angekündigten KI-Features in Apples Betriebssysteme. Für EU-Bürger war es erst mit iOS 18.4 sowie macOS 15.4 so weit, dass Schreibwerkzeuge, Genmoji und Image Playground auf Geräten mit entsprechender Ausstattung verfügbar waren. Das zugrunde liegende Große Sprachmodell (LLM) nennt Apple „Foundation Model“; als Generalist ist es zu weitaus umfangreicheren Leistungen in der Lage, als Apple derzeit anbietet. Ab Herbst können auch externe Entwickler die Foundation-Fähigkeiten in ihren Apps anzapfen, verkündete Apple auf der WWDC 2025. Eine Veröffentlichung auf Apples Machine-Learning-Blog vergleicht die aktuelle Version der Foundation-Models mit denen anderer KI-Assistenten. Die Messgröße: Menschliche Qualitätsbewertung.


Für den Vergleich wurden eine Reihe an Fragen formuliert, welche alle untersuchten Modelle beantworten sollten. Diese umfassten unter anderem. Analyse, Brainstorming, Chat, Klassifizierung, geschlossene und offene Fragen, Coding, kreatives Schreiben, Umformulieren sowie Zusammenfassung bestehender Texte. Die menschlichen Tester bekamen jeweils zwei Antworten auf eine Frage vorgelegt und sollten entscheiden, welche besser ist, oder ob beide gleich gut seien. Dabei flossen auch Faktoren wie regionale Begrifflichkeiten und unnatürliche Formulierungen in ihre Bewertung ein. Der Vergleich fand separat in mehreren Sprachräumen statt: Englisch, Englisch außerhalb der Vereinigten Staaten und „PFIGSCJK“, was für „Portugiesisch, Französisch, Italienisch, Deutsch, Spanisch, vereinfachtes Chiniesisch, Japanisch und Koreanisch“ steht.

In den meisten Vergleichsfällen schlagen sich die Foundation-Antworten recht gut. (Quelle: Apple)

Lokale und Serverleistung
Für die Bewertung der lokalen Foundation-Modelle zog Apple portable Modelle von Alibaba (Qwen 2.5 sowie 3) sowie Google (Gemma 3) heran. Bei den Antworten der Serverversion wagten Apples Entwickler zudem einen Vergleich mit LLMs von Meta (Llama 4 Scout) sowie OpenAI (GPT-4o). Insgesamt zeigten sich die Resultate der eigenen Sprachmodelle in Apples Vergleich in vielen Fällen als zumindest gleichauf und teilweise sogar besser als die Konkurrenz – mit Ausnahme von GPT-4o; hier kann Apple immerhin mit einem recht umfangreichen Anteil an Antworten punkten, bei denen die Antworten aus der „Private Computing Cloud“ ähnlich gut wie die der OpenAI-Konkurrenz erschienen.

Bilderzeugung: OpenAI liegt vorn
Einen ähnlichen Vergleich beim Erzeugen von bildlichen Darstellungen können Apples Modelle nur teilweise bestehen: Während im Vergleich lokaler Modelle die Apple-Intelligence-Resultate noch in knapp drei Viertel aller Fälle besser oder zumindest gleichwertig der Konkurrenz erschienen, waren die Bilder von GPT-4o deutlich besser: weniger als 40 Prozent aller Apple-Bilder überzeugten die Tester im direkten Vergleich zu Grafiken aus der OpenAI-KI.

Bei der Bilderzeugung hat OpenAI derzeit die Nase deutlich vorn. (Quelle: Apple)

Vorteil Apple: Lokal und privat
Im Abschluss heben die Apple-Entwickler ihre Prinzipien hervor, mit denen sich der Konzern von der Konkurrenz absetzen will. Vier Kernaspekte der verantwortungsvollen KI habe man herausgearbeitet:

  • Nutzer mit intelligenten Werkzeugen ermächtigen (sinnvolle KI-Anwendung bieten)
  • Anwender repräsentieren (Reproduktion von Vorurteilen vermeiden)
  • Gestaltung mit Voraussicht und Sorge (Missbrauch verhindern)
  • Privatsphäre schützen (keine Erfassung und Nutzung von Anwenderdaten für KI-Training)

Um einen objektiven Vergleichstest handelt es sich bei dieser Aufstellung nicht, sie bietet vielmehr einen Einblick in die aktuelle Fortentwicklung und in die Ziele, welche sich der Konzern gesetzt hat. Die Kernaussage der Veröffentlichung: Apples Foundation-Modelle liefern zwar nicht in jedem Fall die allerbesten Resultate, aber die Antworten sind gut genug – und lassen sich sicher nutzen.

Kommentare

Tomboman12.06.25 17:24
Ich würde mal sagen, Apple Intelligence ist gleich auf, wenn die Anfrage an ChatGPT weitergeleitet wird…
+4
esc
esc12.06.25 17:35
Wie sagt man noch "Traue keiner Statistik, die du nicht selbst gefälscht hast".
+4
Mostindianer12.06.25 18:27
Apple checkt es nicht!

Die User und Zeitungen beurteilen dies nach einem KI-ChatBot! und da liegt Siri halt nun mal 5 Jahre zurück!

alles andere erzeugt in der Öffentlichkeit kein Aufsehen und auch wenn alles super intelligent in Logic Pro oder Final cut pro wäre, es sind nicht die Tools, welche die grosse Masse berührt.

Apple muss aus Marketing-Gründen Siri aufbohren, somit der einfache Journalist einen direkten Vergleich mit ChatGPT & Co simulieren kann.

oder ganz einfach.. habe gelesen dass die heutigen Bots schlecht im Schachspiel sind und gegen uralte PCs verlieren. wenn Apple hier etwas liefern kann, sorgt dies für aufsehen
-7
Mostindianer12.06.25 19:45
Mostindianer
oder ganz einfach.. habe gelesen dass die heutigen Bots schlecht im Schachspiel sind und gegen uralte PCs verlieren. wenn Apple hier etwas liefern kann, sorgt dies für aufsehen

„Apples Siri, die weltbeste Schachspielerin, deklassiert IBMs Rechner und schickt diese in die Steinzeit zurück.“

Genau so und nicht anders muss es auf Seite 1 der Zeitungen zu lesen sein! Marketing ist alles! dann steigen auch die Aktien wieder schön
+1
MrJava12.06.25 20:15
Zusammen mit ChatGpt funktioniert es doch ganz gut.
-1
Unwindprotect12.06.25 20:47
Mostindianer
„Apples Siri, die weltbeste Schachspielerin, deklassiert IBMs Rechner und schickt diese in die Steinzeit zurück.“

Genau so und nicht anders muss es auf Seite 1 der Zeitungen zu lesen sein! Marketing ist alles! dann steigen auch die Aktien wieder schön

Sorry, aber das ist Quatsch. Der „Schach-Benchmark“ sollte aufzeigen das LLMs grundsätzlich nicht zu so etwas in der Lage sind. Da kann Apple auch nichts dran machen.

News wie in diesem Artikel sind dagegen genau richtig für Entwickler
+3
Nescio12.06.25 21:57
Meines Erachtens ein fragwürdiger Vergleich. Denn Apples lokales Modell konkurriert aus Sicht der meisten Nutzer doch nicht wirklich mit anderen lokalen Modellen, sondern mit den Server-Modellen der Konkurrenz. Abgesehen davon fehlen mit Google und Anthropic zentrale Modelle im Vergleich. Und im Falle von Open AI: GPT-4o ist ein Jahr alt. In dieser Zeit haben sich die Modelle aller großen Anbieter erheblich weiterentwickelt. Man stelle sich das mal auf Hardware übertragen vor: „Unser aktuelles iPhone ist in 60% der Fälle gleich schnell wie das Samsung Galaxy von vor drei Jahren“ - wen soll das überzeugen?
Der Strategie-Schwenk von Apple wird immer deutlicher: da man es selbst nicht konkurrenzfähig hinkriegt, fließen jetzt erhebliche Ressourcen dahin, die Konkurrenz schlecht zu reden.
+1
Weia
Weia12.06.25 23:10
Mostindianer
Apple checkt es nicht!
Glücklicherweise haben wir wir ja Dich.
Mostindianer
Marketing ist alles! dann steigen auch die Aktien wieder schön
Ist der Apple-Aktienkurs der Grund für Deine Aufgewühltheit?
“I don’t care” is such an easy lie. (The Warning, “Satisfied”)
+3
OliverCGN13.06.25 10:21
Unabhängig vom technischen Entwicklungsstand:
Ich mag die "Persönlichkeit" von ChatGPT:
Ich liebe die Gesprächsdynamik und wie die KI Wortwitze aufgreift.
Ich denke, es wird zunehmend wichtiger, dass der User auch die "Persönlichkeit" der KI sympathisch findet.
0
Heldenolli13.06.25 12:58
Interessant ist, dass Apple sich mit dem Google Modell 4b verglichen hat, es gibt aber auch die Modelle 12b und 27b, die dann 12 bzw. 27 Milliarden Parameter beinhalten und erheblich leistungsfähiger, aber auch größer sind.
0

Kommentieren

Sie müssen sich einloggen, um die News kommentieren zu können.