Push-Nachrichten von MacTechNews.de
Würden Sie gerne aktuelle Nachrichten aus der Apple-Welt direkt über Push-Nachrichten erhalten?

Apple verkündet KI-Durchbruch: Bilder per Texteingabe manipulieren und bearbeiten

Apple investiert seit Jahren viel in die Erforschung neuer KI-Technologien. Resultate fließen an allen Ecken und Enden in die Systeme ein, für dieses Jahr steht angeblich auch "Siri 2.0" mit maßgeblichen Neuerungen an. Ein Projekt ist hingegen jetzt schon erschienen, denn das Unternehmen veröffentlichte ein KI-Modell, welches Bildbearbeitung per Texteingabe erlaubt. Anders als bei bisherigen KI-Bilderzeugern dient es nicht der Erstellung neuer Grafiken, stattdessen gibt man der KI vor, wie mit einem bestehenden Bild zu verfahren ist. Das können Prompts wie "Mach den Himmel heller", aber auch "entferne den Weihnachtsbaum hinter den Personen" oder "gib dem Foto eine düstere Stimmung" sein.


MGIE ist Open Source
Apple nennt das als Open Source freigegebene Modell "MGIE", kurz für "MLLM-Guided Image Editing" – wobei MLLM wiederum die Abkürzung von "Multimodal Large Language Model" ist. Zur Erforschung kooperierte man mit der University of California zu Santa Barbara und präsentierte die Resultate erstmals auf der International Conference on Learning Representations. Um die gewünschten Ergebnisse zu erzielen, wird die Nutzereingabe intern zunächst in eine präzisere Aufforderung übersetzt. Das Beispiel aus dem Paper lautet, den Prompt "färbe den Himmel blauer" in "erhöhe die Sättigung der Himmelsbereiche um 20 Prozent" zu verwandeln – und diesen dann weiterzuverwenden.

Ein großer Schritt für KI-Bildbearbeitung
Bei MGIE handelt es sich um einen bemerkenswerten Durchbruch, der Grundlagen für eine neue Generation an Bildbearbeitungssoftware bietet. In der Dokumentation ist die Rede davon, Photoshop-artige Manipulationen am Material vornehmen und neben Farbeffekten oder kleinen Anpassungen auch komplexe, inhaltliche Modifikationen durchführen zu können. Man muss nicht lange nachdenken, um das Potenzial und konkrete Einsatzbereiche zu erkennen. Unbekannt ist, ob ein solches Tool irgendwann direkt in Apple-Programmen wie beispielsweise "Fotos" zum Einsatz kommt.


Erste Demos zum Potenzial der Technologie

Wer einen näheren Blick auf das Projekt werfen möchte, findet den Code auf GitHub. Eine privat gehostete Online-Demo gibt es ebenfalls, allerdings ist die Seite derart stark frequentiert, dass man recht lang auf Zugriff warten muss. Das gesamte Paper steht ebenfalls öffentlich zur Verfügung, darin werden auf 24 Seiten die wichtigsten Aspekte der Technologie beschrieben.

Kommentare

Stresstest07.02.24 17:31
Also wenn ich mir da im Beispielbild die "Wellen" im Fluss anschaue, dann weiß ich nicht, ob man da von einem Durchbruch sprechen kann
0
Michael Lang aus Rieder07.02.24 17:40
Ok perfekt ist das wohl nicht. Aber wenn das zB. in Photos käme, wäre das schon ein cooles Feature.
+3
Nightlauncher07.02.24 17:52
Woher kam eigentlich das Einhorn auf dem Original Bild 🙃
+10
Nebula
Nebula07.02.24 17:55
Wie gut, dass ich nicht mehr mit Bildbearbeitung mein Geld verdiene. Was die KI hier jetzt schon leistet, ist leider erstaunlich gut und wird einige Jobs überflüssig machen. Die guten Leute wissen das Werkzeug dann auch für sich zu nutzen. Das passiert ja jetzt schon. Ich selbst nutze das zur Ideenfindung und -vermittlung. Nie war es einfacher, seine Ideen anderen mitzuteilen. Ein Hund mit Bat-Mobil lässt sich vielleicht noch schnell skizzieren, aber dann ist immer noch die Vorstellungskraft des Gegenübers gefragt. Mit den "photorealistischen" KI-Skizzen erreicht man viel mehr Leute, wie ich bereits feststelle. Und die Leute, die nie verstanden haben, dass eine Skizze nicht das Endresultat sein wird ("wollen wir das wirklich so gekritzelt präsentieren?") bekommt man ja ohnehin nicht dazu, Gestaltung als Prozess zu begreifen. Leider sind das oft dann auch die Leute, die dann entscheiden, dass die KI-Bilder doch bereits ausreichen.
»Wir werden alle sterben« – Albert Einstein
+24
Stresstest07.02.24 18:07
Nebula
... die dann entscheiden, dass die KI-Bilder doch bereits ausreichen.

Das ist mir auch schon aufgefallen, dass nun plötzlich Mitarbeiter so etwas erstellen, der Aufgabe das eigentlich überhaupt nicht ist, nur damit aus der Idee schon einmal etwas zu Anschauen worden ist.
Und am Ende bleibt dass dann sogar im finalen Ergebnis drin
+12
pixler07.02.24 18:42
Ich sehe jeden Tag so viel KI mist. Jüngst hat die SBB (Schweizerische Bundesbahn) eine Werbung mit durch KI erstellten Illustrationen verteilt. Die Illus waren voller Fehler und niemand in der Agentur hat es bemerkt. Das zeigt mir wohin die Reise geht = Agentur und Kunde ist mit dem erstenbesten Resultat zufrieden ! Wenn das die Zukunft der Grafik ist, dann gehe ich Schafe hüten oder Spargeln stechen. Danke dann. Die Menschheit ist am verblöden. Nicht die KI ist das Problem sondern die Leute welche mit diesem Mist zufrieden sind.
+38
Gammarus_Pulex
Gammarus_Pulex07.02.24 19:29
Jep, Hauptsache schnell und günstig, die Qualität ist egal. Oder schlimmer: Fehlende Qualität wird gar nicht erst wahrgenommen.

Wegwerfmarketing und -werbung.
+11
rafi07.02.24 19:41
pixler
Die Illus waren voller Fehler und niemand in der Agentur hat es bemerkt. Das zeigt mir wohin die Reise geht = Agentur und Kunde ist mit dem erstenbesten Resultat zufrieden !

War heute essen. Ganz KI frei. Das Tischset mit Werbung einer grossen Brauerei war grösstenteils verpixelt, schien ebenfalls niemanden zu stören. Ausser mich natürlich
Eine KI hätte das besser gemacht
+10
Brunhilde_von_der_Leyen07.02.24 20:12
pixler
Ich sehe jeden Tag so viel KI mist. Jüngst hat die SBB (Schweizerische Bundesbahn) eine Werbung mit durch KI erstellten Illustrationen verteilt. Die Illus waren voller Fehler und niemand in der Agentur hat es bemerkt. Das zeigt mir wohin die Reise geht = Agentur und Kunde ist mit dem erstenbesten Resultat zufrieden ! Wenn das die Zukunft der Grafik ist, dann gehe ich Schafe hüten oder Spargeln stechen. Danke dann. Die Menschheit ist am verblöden. Nicht die KI ist das Problem sondern die Leute welche mit diesem Mist zufrieden sind.

Den Mist gab es schon immer, handgemacht, ganz ohne KI. Frag Doc Baumann
+13
TotalRecall
TotalRecall07.02.24 21:32
Jo stimme zu. Ein Vergleich. Damals zu Zeiten der analogen Fotografie als man ein Auge für Situationen, Momente brauchte. Auch der Aufwand, toll handwerklich! Dann als es zunehmend digital wurde, och egal ich "knipse" halt und such das beste aus x Aufnahmen raus. Menge = Verlust an individuellem, künslerischem
pixler
Ich sehe jeden Tag so viel KI mist. Jüngst hat die SBB (Schweizerische Bundesbahn) eine Werbung mit durch KI erstellten Illustrationen verteilt. Die Illus waren voller Fehler und niemand in der Agentur hat es bemerkt. Das zeigt mir wohin die Reise geht = Agentur und Kunde ist mit dem erstenbesten Resultat zufrieden ! Wenn das die Zukunft der Grafik ist, dann gehe ich Schafe hüten oder Spargeln stechen. Danke dann. Die Menschheit ist am verblöden. Nicht die KI ist das Problem sondern die Leute welche mit diesem Mist zufrieden sind.
-1
Bodo_von_Greif07.02.24 21:48
Verfolge ich leider seit Jahrzehnten (z.B. Hardwarebeschaffung) : Es wird das Billigste genommen nicht das Preiswerteste
[x] nail here for new monitor
+6
ÄNDY
ÄNDY08.02.24 01:35
Nach 10 Minuten hat iKI (idiot KI) in der Online Demo folgendes generiert.
Instruction: flowers on the road


Unter dem Bild stand:
Expressive Instruction:
If the image were to follow the instructions and show 'adorable' or 'adolable,' it would depict a snowy road with a beautiful snow-covered forest in the background.The snow would be falling gently, creating a serene atmosphere.
+8
Apple@Wien
Apple@Wien08.02.24 07:55
Nightlauncher

„Hey Siri, zeichne mir einen Hasen.“😎
+2
Stresstest08.02.24 11:28
ÄNDY
Nach 10 Minuten hat iKI (idiot KI) in der Online Demo folgendes generiert.
Instruction: flowers on the road

Ähnliches Ergebnis habe ich auch bekommen.
Was auffiel:
- Es sah überhaupt nicht natürlich aus.
- Es wurde das komplette Bild bearbeitet: Schrift war irgendwie gar nicht mehr zu lesen
- Auch andere Elemente waren komplett wellig und verzerrt

Im Vergleich zu Photoshop, wo ich ja einen Bereich im Bild auswähle und dann dort etwas platzieren kann, doch Welten.

Wobei ich auch die Intention von Apple verstehe, dass es eben gewisse Elemente ohne Auswahl verändern kann. Eben einen Himmel und Wasser verändern, ohne dass ich diesen speziell auswählen muss.
0
LoCal
LoCal08.02.24 11:49
Die Ergebnisse sind wirklich enttäuschend


Ich hab zwar keine Lösung, doch ich bewundere dein Problem
-2
Raziel108.02.24 12:52
Ich fürchte hier verstehen wieder viele nicht was ein Model ist und den Durchbruch dabei. Die Demos einer Umsetzung sind nichts weiter als Demos. Da geht es nicht um die sofort einsatzbaren High End Grafiken.
+15
Nebula
Nebula08.02.24 14:20
Man muss bei den Prompts auch schon etwas konkreter sein als "flowers on the road". Das ist ja eher ein Prompt für einen Bildgenerator statt für Bildmanipulation. Da fehlt zumindest ein Verb wie "put". Ich hatte bei einem Familienfoto mit "make all people female" genau das bekommen, was ich erwartete. Das Ergebnis war unbrauchbar, weil alle den gleichen Gesichtsausdruck erhielten, aber an sich schon beeindruckend, weil es zeigt, wohin die Reise geht. Man schaue nur die Evolution von Midjourney innerhalb eines Jahres. Da ist noch so viel Luft nach oben.
»Wir werden alle sterben« – Albert Einstein
+7
LoCal
LoCal08.02.24 18:40
Raziel1
Ich fürchte hier verstehen wieder viele nicht was ein Model ist und den Durchbruch dabei. Die Demos einer Umsetzung sind nichts weiter als Demos. Da geht es nicht um die sofort einsatzbaren High End Grafiken.

Naja, schau dir die Bilder im Artikel an:
„Giver her a hat“ ist wesentlich unspezifischer als meines und vergleiche die Ergebnisse.
Ich hab zwar keine Lösung, doch ich bewundere dein Problem
-3
Phil Philipp
Phil Philipp09.02.24 14:13
So richtig bis zwei zählen kann die KI aber auch nicht:
0
ricoh09.02.24 23:11
Was wird erst werden, wenn das Netz voller KI-generierter Bilder ist und die KI sich mehr und mehr an ihren eigenen Werken orientiert. Dann nimmt die Sache einen ganz eigenen Verlauf.
0
LoCal
LoCal10.02.24 20:11
Phil Philipp
So richtig bis zwei zählen kann die KI aber auch nicht:

was mich wundert ist, dass bei Dir das Originalbild im Ergebnis erscheint.
Ich hab zwar keine Lösung, doch ich bewundere dein Problem
0
AJVienna13.02.24 12:28
ricoh
Was wird erst werden, wenn das Netz voller KI-generierter Bilder ist und die KI sich mehr und mehr an ihren eigenen Werken orientiert. Dann nimmt die Sache einen ganz eigenen Verlauf.
KIs werden mittlerweile zunehmend auf Basis eigenen Outputs trainiert, weil das tatsächlich die Qualität verbessert. Ähnlich wie ein Mensch lernt.
0

Kommentieren

Sie müssen sich einloggen, um die News kommentieren zu können.