Apple präsentiert Forschung: KI findet Programmierfehler, erzeugt Tests – und repariert sogar Code

Programmieren ist eine hochabstrakte Tätigkeit. Als Entwickler schreibt man Algorithmen in einer Programmiersprache, welche von anderen Entwicklern erfunden wurde, um zwischen Code, Betriebssystem und Hardware zu vermitteln. Über die Ebenen geht manches in der Übersetzung verloren, und so manche Fehlermeldung ist für den Auftraggeber ebenso unverständlich wie der ursprüngliche Code dem Compiler erschien. Als Hardware-, Software- und Betriebssystemhersteller sowie Anbieter der IDE Xcode kann Apple wahrscheinlich ein Lied davon singen. Die KI-Entwicklung, welche in Zusammenarbeit mit Apple entstand, möchte diese Verständigungsprobleme angehen. Dazu präsentierte das Machine-Learning-Blog des Konzerns drei interessante Konzepte: eine innovative Fehleranalyse, eine automatisierte Testerstellungsroutine sowie ein Fitnessstudio („Gym“) für Software-Engineering-Agenten.

Einfache Syntaxfehler wie zu wenige oder zu viele Satzzeichen oder eine unbotmäßige Kombination von Tabs und Leerzeichen können viele Compiler bereits ohne umfangreiche Intelligenz abfangen. Komplexere Fehler erfordern eine detailliertere Erkennung der Zusammenhänge. Solche wollen Apples Forscher mit einer KI-ML-Konstruktion angehen, welche sie mit dem Kürzel ADE-QVAET zusammenfassen. Mit deren Unterstützung sollen Code-Konstruktionen frühzeitig erkannt werden, welche im späteren Fortschreiten mit hoher Wahrscheinlichkeit zu Fehlern führen. Zudem zeigte der Ansatz eine hohe Erkennungswahrscheinlichkeit und reduzierte den Bedarf an menschengeführten Tests.

Testerstellung autmatisieren
Ein weiteres Paper nimmt sich der Testerstellung an, welche bei komplexen Softwareprojekten einen zunehmenden Umfang der Entwicklungsressourcen verschlingt. Tests überprüfen, ob die eigene Software die Resultate produziert, die man bei einer definierten Eingabe haben will. Mit dem Agentic RAG soll nun ein Mechanismus entstanden sein, der in beispielhaften Softwaregroßprojekten eines Unternehmens zu schätzungsweise 35 Prozent Kostenersparnis führt.

Training für Software-Agenten
Eine dritte Veröffentlichung widmet sich einem etwas abstrakteren Ziel, nämlich der Optimierung von KI-Agenten. Software-Engineering-Agenten (SWE) beabsichtigen, bei der Entwicklung viele Arbeitsschritte abzunehmen. Sie analysieren Fehlerberichte (etwa GitHub Issues), versuchen die Ursache zu ergründen, und schlagen eine Behebung des Problems in Form von vorgefertigtem Programm-Code vor. Für diese gibt es bisher zwar Bewertungsverfahren zur Leistungsfähigkeit (SWE-Bench), aber keine etablierte Methode, sie auf typische Fehler zu trainieren. Dies soll das mithilfe von Apple entstandene „SWE-Gym“ darstellen. Es besteht aus knapp 2500 Programmieraufgaben in der Skriptsprache Python. Die Problembeschreibungen sind in natürlicher Sprache verfasst, jede Aufgabe umfasst zudem den ursprünglichen Code und passende Laufzeittests. Die Software haben die Forscher auf GitHub veröffentlicht.

Kommentare

Nebula22.10.25 08:40

Schön, dass sich Apple hier etwas in die Karten schauen lässt, bevor daraus Produkte werden (oder auch nicht). Letztlich ist Apples KI-Blog nicht mehr als ein Besänftigungsportal für Aktionäre. So kann Apple ohne vorzeigbarer KI schön behaupten, sie würden großes in dem Marktsegment leisten und würden das Problem nicht aussitzen.

»Wir sind hier, um eine Delle im Universum zu hinterlassen.« – Steve Jobs

Raziel122.10.25 09:05

Nebula

Sie Leisten auch großes. Nur weil sie nicht wie die Konkurrenz irgendwelche third party Systeme oder sonstige ominöse Implementationen ins rennen werfen und dabei auf jeglichen Datenschutz verzichten muss Apple hier nicht auch nach vorne rushen. Die haben da ganz andere Pläne

Sitox22.10.25 11:48

Raziel1

nicht wie die Konkurrenz irgendwelche third party Systeme oder sonstige ominöse Implementationen ins rennen werfen und dabei auf jeglichen Datenschutz verzichten muss Apple hier nicht auch nach vorne rushen. Die haben da ganz andere Pläne

Was sind „irgendwelche third party Systeme oder sonstige ominöse Implementationen“?

frankh22.10.25 18:32

Das erste Paper kann ich auf die Schnelle nicht einschätzen.

Bei dem AgenticRAG würde ich aber sagen "das macht man halt jetzt so" (Zeit und Geld vorausgesetzt). Ausserdem haben sie das nicht an eigener Software erprobt, sonder an <Trommelwirbel> SAP Migrationsprojekten, also Enterprise-Kram

Das Dritte bezieht sich auf python. Spielt in der KI-Welt natürlich eine große Rolle, aber wieder nicht für OS- und App-Entwicklung.

wi36822.10.25 22:28

Also beim programmieren wird das wertgeschätzt, wenn der eigene geheime Programmcode nicht über das Internet einer KI unterzogen werden muss.

ssb23.10.25 16:35

Es gibt auch eine Studie, die festgestellt hat, dass KI erfahrene Entwickler bremst und nicht unterstützt.
Eine Gruppe von erfahrenen Entwicklern sollte bei einem OpenSource-Projekt ein Feature ergänzen. Vorher glaubten sie, dass sie mit KI ca 15% effizienter seien. Danach glaubten sie, dass sie mit KI tatsächlich 10% effizienter waren. Die Kontrollgruppe, die keine KI eingesetzt hatte, war aber 12% schneller.

Am Ende: KI kann unerfahrenen „Entwicklern“ helfen, aber Erfahrung nicht ersetzen. Das gefällt der Industrie aber gar nicht, weil erfahrene Entwickler eben teuer sind.

Apple präsentiert Forschung: KI findet Programmierfehler, erzeugt Tests – und repariert sogar Code

Kommentare

Kommentieren

Sie müssen sich einloggen, um die News kommentieren zu können.