Push-Nachrichten von MacTechNews.de
Würden Sie gerne aktuelle Nachrichten aus der Apple-Welt direkt über Push-Nachrichten erhalten?

KI-Forschung: Apple kombiniert "verworfene" Algorithmen für effiziente Bilderzeugung

Bilderzeugung mittels Künstlicher Intelligenz erfreut sich zunehmender Beliebtheit. Apple macht zunehmend Gebrauch davon. Viele denken dabei zunächst an „Image Playground“, welche in der EU seit macOS 15.4 auf Apple-Silicon-Macs Teil des Betriebssystems ist. Doch auch die „Bereinigen“-Funktion sowie eine Umwandlung zweidimensionaler Fotos in „spatial Images“ für die Apple Vision Pro nutzt KI-Algorithmen. In zwei wissenschaftlichen Publikationen zeigen Apple-Entwickler nun einen vielversprechenden Ansatz auf, der auf Algorithmen mit normalisierendem Fluss setzt. Diese sollen insbesondere bei Bilderzeugung vorteilhaft sein – und bei lokaler anstatt cloud-basierter Generierung.


Die verwendeten Algorithmen, bekannt als „normalisierter Fluss“, sind keine Neuentwicklung, sondern wurden bereits vor zehn Jahren umfangreich beschrieben. Aus mathematischer Sicht besteht ihr Vorteil darin, dass sie für jeden Trainingsdatensatz einen Wahrscheinlichkeitswert „schätzen“. Bisherige Bilderzeugungen auf Basis von normalisiertem Fluss resultierten allerdings in unscharfen Bildern. Der Ansatz, den Apple-Entwickler vorstellen, kombiniert Transformer-Modelle mit Normalisiertem Fluss (TARFflow). Ein auf diesem Ansatz trainiertes KI-Modell erzeugt recht effizient überzeugende Bilder, allerdings bleiben diese auf niedriger Auflösung.

Höhere Auflösung mit STARFLOW
Dieser konzeptuellen Schwäche widmet sich die zweite Veröffentlichung, welche Apple im konzerneigenen Machine-Learning-Blog präsentierte. In dieser optimieren Apples Entwickler den TARFlow-Algorithmus in einer Form, dass hochauflösende Bildresultate entstehen. STARFlow nennen die Entwickler das Resultat, dem sie einen Durchbruch in der KI-Forschung zuschreiben:
STARFlow erzielt konkurrenzfähige Ergebnisse sowohl bei der klassen- als auch bei der textbedingten Bilderzeugung, wobei die Qualität der Stichproben an die der modernsten Diffusionsmodelle heranreicht. Unseres Wissens ist dies die erste erfolgreiche Demonstration Normalisierter-Fluss-Algorithmen in dieser Größenordnung und Auflösung.

STARFlow verändert Bilder auf Basis einer Textanweisung. (Quelle: arXiv)

Optimiert für „Inpainting“
Als potenziellen Anwendungsfall sehen die Entwickler das Übermalen bestimmter Bereiche eines bestehenden Bildes mit einem Wunschelement. Dafür definiert der Nutzer einen Bildbereich und beschreibt, was dort erscheinen soll. Der definierte Bereich wird dann mit einem Gauss-Unschärfe-Effekt versehen, woraus STARFlow dann erfolgreich ein Wunschelement erzeugen kann – etwa einen Hut auf dem Kopf eines Corgi. Ebenso könnte ein solches KI-Modell dabei helfen, störende Bildelemente zu entfernen oder verdeckte Elemente hinter einer Person im Bildvordergrund zu berechnen, um Bilder mit einem Räumlichkeitseffekt zu versehen.

Kommentare

eastmac
eastmac24.06.25 15:38
Alles in Image Playground sieht immer nach schwer depressiven Menschen aus.
Es kann nur besser werden.
0
Nebula
Nebula24.06.25 16:01
Wie sehen denn schwer depressive Menschen aus? Oder meinst du traurig/niedergeschlagen? Also ich bekomme auch lachende Gesichter hin und es sieht nicht schlimmer aus als die Animojis.
»Wir waren schon immer schamlos darin, großartige Ideen zu stehlen.« – Steve Jobs
+4
Tom56424.06.25 16:58
Mhh, in Playground lächen, bzw. lachen die Personen fast immer. Ich frage mich allerdings, wer nutzt das wirklich. Mein Ausprobiertrieb war ziemlich schnell erloschen, insbesondere, weil die Einschränkungen einfach zu extrem sind. Es gibt fast nur Portrait Bilder von Personen. Warum? Irgendwie verstehe ich die App nicht und genauso wenig Apple.
0
Nebula
Nebula24.06.25 20:08
Du musst ja keine Personen nehmen, siehe mein Profilbild.
»Wir waren schon immer schamlos darin, großartige Ideen zu stehlen.« – Steve Jobs
+1
fliegerpaddy
fliegerpaddy24.06.25 20:37
Apple Intelligence kann es einfach nicht. Zumindest mich kann das Ding nicht darstellen. Ich habe da viel zu viele Haare Ähnlichkeit ist gleich null.
+1
Moranai25.06.25 07:23
Als ich Playground das letzte mal ausprobiert habe, wollte ich eine schwarze Katze haben mit verschiedenen Hintergründen. Wurde nicht erstellt, da gegen die Richtlinien. Danach die App gelöscht. Jetzt wo ich das Bild von Nebula sehe, könnte ich dem ganzen nochmal einen Versuch geben.
0

Kommentieren

Sie müssen sich einloggen, um die News kommentieren zu können.