Cloudflare erklärt, wie sie ein Fünftel des Internets lahmlegten


Gestern war die Internet-Landschaft für einige Stunden massiv von Störungen betroffen. Viele namhafte Dienste und Webseiten verweigerten plötzlich den Zugriff und zeigten stattdessen nur Fehlermeldungen an. Was im Web-Alltag hin und wieder einmal auftaucht, nämlich an der Cloudflare-Schranke hängenzubleiben, betraf plötzlich zahlreiche Angebote dauerhaft. Der Sinn von Cloudflare ist eigentlich, nur schädliche Aktivitäten wie beispielsweise DDoS-Attacken oder massenhaft Bot-Zugriffe zu blockieren – gestern hingegen sorgte ein Ausfall dafür, dass beispielsweise ChatGPT ganz ohne Publikum dastand. Schätzungen zufolge bearbeitet Cloudflare rund 20 Prozent des globalen Webverkehrs, dementsprechend ausgeprägt gestalteten sich die daraus resultierenden Probleme.
Man dachte erst an einen CyberangriffNun hat sich Cloudflare noch einmal zu Wort
gemeldet und ausführlicher erläutert, warum es zu dieser Panne kommen konnte. Zunächst habe die Art der Störung darauf hingedeutet, Opfer eines massiven Cyberangriffs zu sein. Das Verhalten sprach den Erklärungen zufolge genau dafür, weswegen man Zeit mit der Fehlersuche an einer falschen Stelle verschwendete – auch der Ausfall der eigenen Statusseite, welche nicht auf dem normalen CDN gehostet ist, wies in genau diese Richtung. Ein Versuch, sämtliche Angebote zeitgleich in die Knie zu zwingen, so die naheliegende Vermutung.
...doch es war ein KonfigurationsfehlerEs stellte sich jedoch heraus, dass der Fehler hausgemacht war und mit einer fehlerhaften Berechtigungsänderung in einer Datenbank zusammenhing. Die "Feature Files"-Datei wird vom Netzwerk genutzt, um Regeln und Muster für die Erkennung von Angriffen festzulegen. Allerdings führte der Konfigurationsfehler zur Duplizierung von Einträgen, was gleichzeitig die Dateigröße verdoppelte. Jede Maschine weltweit erhielt nun besagte aufgeblähte Feature-Datei, welche über der möglichen Maximalgröße lag – und die Software stürzte beim Importversuch umgehend ab. Da diese essenziell für die Traffic-Weiterleitung ist, fiel somit das gesamte Netzwerk aus.
Die Entschuldigung von Cloudflare an alle NutzerVon offizieller Seite gibt es keinen Versuch der Beschönigung, stattdessen heißt es in der Stellungnahme: Wir entschuldigen uns für die Auswirkungen auf unsere Kunden und auf das Internet insgesamt. Angesichts der Bedeutung von Cloudflare im Internet-Ökosystem ist jeder Ausfall eines unserer Systeme inakzeptabel. Dass es eine Zeit gab, in der unser Netzwerk nicht in der Lage war, Datenverkehr zu routen, schmerzt jedes einzelne Mitglied unseres Teams zutiefst. Wir wissen, dass wir euch heute im Stich gelassen haben.