Push-Nachrichten von MacTechNews.de
Würden Sie gerne aktuelle Nachrichten aus der Apple-Welt direkt über Push-Nachrichten erhalten?

Beeindruckende Bildanalyse im Live-Video – Apples Erkennungs-KI jetzt im Browser testen

Der KI-Hype, welcher mit der Veröffentlichung von ChatGPT im Herbst 2022 seinen Anfang nahm, ist ungebrochen. In vielen Bereichen stehen generative KIs im Mittelpunkt des öffentlichen Interesses; sie erzeugen Illustrationen, Texte oder Videos auf Geheiß (Prompt) des Anwenders. Analytischen KIs bleibt das Rampenlicht meist verwehrt, dabei arbeiten sie mit beeindruckender Genauigkeit und produzieren deutlich weniger kontroverse Resultate. Sie transkribieren Podcasts und formulieren Bildbeschreibungen – oder analysieren Videofeeds. Apple stellte im Mai eine analytische Video-KI namens FastVLM vor, die Live-Video analysiert. Seit einigen Tagen können Mac-Anwender mit Apple-Silicon-Mac FastVLM zusätzlich im Browser ausprobieren.


Gleichzeitig mit der Veröffentlichung der Forschungsschrift veröffentlichten Apples KI-Forscher mehrere Versionen des FastLVM-Modells auf GitHub. Nun, gut vier Monate später, publizierte der Konzern dieselben Modelle auf der KI-fokussierten Programmierplattform Huggingface – und damit einhergehend auch eine interaktive Browser-Demonstration. Anders als die bisherigen Veröffentlichungen benötigt man für diese keine Programmierkenntnisse, um sie zum Laufen zu bringen – lediglich passende Hardware und einen Chrome-Browser setzt die experimentelle Videoanalyse voraus.

Laufende Bildanalyse
Beim Aufrufen der Website erlaubt man dieser zunächst den Zugriff auf die Webcam des Macs. Als Nächstes klicken Sie auf „Start Live Captioning“. Falls Sie einen Safari-Browser verwenden, ist das Experiment verfrüht beendet – die interaktive Demo setzt einen auf Chrome basierenden Browser voraus. Das kann auch ein datenschutz-fokussierter Abkömmling wie Brave sein. Ist diese Voraussetzung erfüllt, lädt die Website das kleinste Sprachmodell mit einer halben Milliarde (0,5 B) Parametern. Dies dauert je nach Internetverbindung und Prozessorleistung unterschiedlich lang; einige Minuten Geduld sollte man aufbringen. Im Anschluss füllt das aktuelle Videobild das Browserfenster, in dem unten rechts in regelmäßigen Abständen eine neue Bildbeschreibung erscheint.


Im Browser erscheint ein Bild der Webcam, zu der alle paar Sekunden eine Beschreibung generiert wird.


Fragen erlaubt
In der unteren linken Ecke erscheint der Prompt; standardmäßig fordert dieser eine allgemeine Bildbeschreibung an. Sie können aus einigen vorformulierten Fragen wählen oder eine eigene Frage stellen. Die Bildbeschreibungen erscheinen erstaunlich schnell, selbst auf einem M1-Mac mini. Apple Silicon ist Voraussetzung, ebenso eine Webcam. Wer ein Continuity-fähiges iPhone besitzt, kann dieses als Bildgeber einbinden. Ein Blick in die Chip-Auslastung zeigt, welche Rechenkerne FastVLM beansprucht: Es belegt die GPU-Kerne mit Beschlag, aber auch die NPU-Kerne leisten einen Beitrag.

Verwendet man FastVLM im Browser, werden sowohl Grafik– als auch Neuralkerne beansprucht.

Kommentare

eastmac
eastmac03.09.25 08:48
Chrome?
Nicht mal der eigene Safari?
+3
Spacely03.09.25 09:04
eastmac
Chrome?
Nicht mal der eigene Safari?
Das gleiche dachte ich auch.
Apple entwickelt etwas für dessen Nutzung man einen Chrome Browser braucht?
+3
mabi03.09.25 09:54
Spacely
eastmac
Chrome?
Nicht mal der eigene Safari?
Das gleiche dachte ich auch.
Apple entwickelt etwas für dessen Nutzung man einen Chrome Browser braucht?

Nein, natürlich nicht– dem KI-Algorithmus, den Apple entwickelt hat, ist es völlig schnurz, über welchen Weg (z.B. Browser) er auf einen Rechner kommt, der ihn ausführen kann. Aber die Plattform Huggingface (die nix mit Apple zu tun hat), auf der die Demo gehostet wird, unterstützt nun mal (verständlicherweise) nur Chrome.
+10
eastmac
eastmac03.09.25 11:01
mabi
Spacely
eastmac
Chrome?
Nicht mal der eigene Safari?
Das gleiche dachte ich auch.
Apple entwickelt etwas für dessen Nutzung man einen Chrome Browser braucht?

Nein, natürlich nicht– dem KI-Algorithmus, den Apple entwickelt hat, ist es völlig schnurz, über welchen Weg (z.B. Browser) er auf einen Rechner kommt, der ihn ausführen kann. Aber die Plattform Huggingface (die nix mit Apple zu tun hat), auf der die Demo gehostet wird, unterstützt nun mal (verständlicherweise) nur Chrome.

Danke.
+3
Spacely03.09.25 12:45
mabi
Spacely
eastmac
Chrome?
Nicht mal der eigene Safari?
Das gleiche dachte ich auch.
Apple entwickelt etwas für dessen Nutzung man einen Chrome Browser braucht?

Nein, natürlich nicht– dem KI-Algorithmus, den Apple entwickelt hat, ist es völlig schnurz, über welchen Weg (z.B. Browser) er auf einen Rechner kommt, der ihn ausführen kann. Aber die Plattform Huggingface (die nix mit Apple zu tun hat), auf der die Demo gehostet wird, unterstützt nun mal (verständlicherweise) nur Chrome.

Danke!
Beruhigend.
+1

Kommentieren

Sie müssen sich einloggen, um die News kommentieren zu können.