US-Regierung interveniert: Fable 5 vorläufig nicht mehr verfügbar


Das frisch veröffentlichte Fable 5 sollte Missbrauch vorbeugen: Bei Anfragen zu Cybersicherheit, Chemie und Biologie sollte es automatisch auf ein schwächeres Modell wechseln. Der Erfolg dieser Fähigkeitseinschränkungen ist allerdings umstritten: Nach Berichten über ein erfolgreiches Aushebeln forderte die US-Regierung, dass Fable vorläufig nur Nutzern US-amerikanischer Herkunft bereitgestellt werden dürfe. Anthropic
sieht keinen Weg, dies zu gewährleisten, und nahm das neue Sprachmodell komplett aus dem Angebot.
Bevor die neueste Version des großen Sprachmodells unter dem Namen Fable 5 in der
vergangenen Woche online ging, hatte Hersteller Anthropic vorab vor den umfassenden Fähigkeiten der unbeschränkten Mythos-Variante gewarnt: Diese sei viel zu mächtig, um sie der Allgemeinheit zur Verfügung zu stellen. Für mehrere Wochen gewährte das Unternehmen nur ausgewählten Regierungsvertretern und Sicherheitsforschern den Zugriff. Anthropic beharrt auf dem Standpunkt, dass Fable weitestmöglich sicher sei, und hält die Aufforderung der US-Regierung für überzogen.
Ursache unklarDie Aufforderung wurde vom Handelssekretär Kevin Lutnick
verfasst. Als Auslöser nannte dieser den Bericht eines Unternehmens, welches behauptete, die Sicherheitsmaßnahmen erfolgreich umgangen zu haben. Anthropic selbst erhielt bisher keinen Fehlerbericht, welcher auf eine nennenswerte Umgehung der Sicherheitsmaßnahmen hindeute.
Mehrstufige SicherheitIm
Statement räumt Anthropic ein, dass es keinen hundertprozentigen Schutz in KI-Modellen gebe. Deshalb habe man bei Fable 5 einen mehrstufigen Ansatz gewählt: Jailbreaks seien entweder auf sehr geringe Bandbreite beschränkt oder sehr „teuer“ zu generieren. Zugleich werden alle Anfragen kontinuierlich beobachtet, um entdeckte Umgehungsstrategien schnellstmöglich zu stoppen. Außerdem speichere das Unternehmen sämtliche Anfragen für einen Zeitraum von 30 Tagen, um Übertritte zu ahnden.
"Keine ernsthafte Gefahr"In den gesammelten Abfragen haben Anthropics Sicherheitsforscher bisher keinen Fall entdecken können, bei dem die Antworten von Fable 5 die Öffentlichkeit gefährden könnten. Der Fall, den sie als mögliche Ursache für die Anweisung der US-Regierung identifiziert hatten, wäre in diesem Umfang ebenso mit KI-Modellen anderer Hersteller möglich gewesen – etwa GPT-5.5 von OpenAI. Das Versprechen, weitere Details binnen 24 Stunden zu liefern, konnte Anthropic allerdings nicht einhalten.
Kooperation trotz ProtestMythos 5, welches Anthropic bestimmten Forschern und Sicherheitsbehörden ohne Einschränkungen bereitgestellt hatte, bleibt vorerst ebenso wie Fable 5 offline. Grundsätzlich bleibe man davon überzeugt, dass Regierungen eine Nutzung von KI-Modellen einschränken dürfen. Die Voraussetzung stelle eine etablierte Vorgehensweise, welche transparent, gerecht und klar sei sowie auf technischen Fakten beruhe. „Wir glauben, dass sämtliche neuen Modell-Veröffentlichungen der fortschrittlichsten Modell-Anbieter zum Erliegen kommen, wenn dieser Standard auf die gesamte Industrie angewandt wird.“ Vor zwei Wochen hat Anthropic allerdings noch ebendies gefordert: ein welt- und industrieweites
Moratorium bei der Weiterentwicklung von KI-Modellen.