Cloudflare Chaos: Wie ein kleiner Fehler das Netz weltweit lahmlegte

Gestern Nachmittag passierte etwas, das vielen von uns ein ungutes Gefühl gab: Das halbe Internet brach zusammen. Zumindest fast. Der Grund war kein Hackerangriff oder ein ausgeklügelter Cyberangriff, sondern ein technischer Fehler bei Cloudflare, jenem Unternehmen, das einen enormen Teil des weltweiten Datenverkehrs bedient. Und ganz ehrlich: Ich war selbst kurz irritiert, als plötzlich Dienste wie ChatGPT, X oder Shopify nicht mehr reagierten.
Der Tag, an dem ein Fehler das Internet ins Stolpern brachte
Der Ausfall begann gegen 11:20 Uhr MEZ und dauerte rund vier Stunden, bis um etwa 16:30 Uhr wieder alles stabil lief. In dieser Zeit wurden viele der bekanntesten Plattformen plötzlich unzugänglich: ChatGPT von OpenAI, Shopify, X. Der ganze Mix moderner Dienste! Nutzer sahen nicht mehr ihre gewohnten Seiten, sondern Fehlermeldungen, wie „Lassen Sie challenges.cloudflare.com zu, um fortzufahren“. Laut Cloudflare war ein ganz banales, aber folgenschweres Problem im Bot-Management Schuld. Dort hatte eine Änderung der Zugriffsrechte in der Datenbank Kettenreaktionen ausgelöst. Genauer: Das System erzeugt aus jedem eingehenden Request eine sogenannte Feature-Datei, eine Art Merkmalsprofil, das auf maschinellem Lernen basiert. Wegen eines Fehlers im ClickHouse-Abfrageverhalten wurden doppelte Einträge angelegt, was die Datei ungeahnt groß werden ließ.
Und hier kommt die Ironie: Der Schutzmechanismus, konzipiert, um Überlastungen zu vermeiden, schlug fehl. Die Datei überschritt eine festgelegte Maximalgröße, woraufhin die Server abstürzten. Der Schutzmechanismus wurde selbst zum Auslöser der globalen Störung.
Warum ist das so brisant? Weil Cloudflare zu den ganz Großen in der CDN-Branche gehört. Der Dienst fungiert als Vermittler zwischen Websites und Besuchern, er beschleunigt Ladezeiten und sichert Websites gegen Angriffe ab. Wenn Cloudflare ausfällt, trifft das nicht nur die bekannten Plattformen, sondern auch tausende kleinere Seiten, die auf die Infrastruktur angewiesen sind.
Betroffen waren unter anderem: X (ehemals Twitter), Spotify, Discord, Zoom, Canva, IKEA, Uber, Indeed, Claude AI, Google Store und viele andere. Cloudflare reagierte schnell: Das Unternehmen entschuldigte sich öffentlich, CEO Matthew Prince sprach von dem schlimmsten Vorfall seit 2019. Gleichzeitig kündigte man konkrete Maßnahmen an. Geplant sind unter anderem robustere Konfigurationsdateien, globale Notfall-Schalter und eine tiefgehende Überprüfung kritischer Module.
Was wir daraus lernen können
Dieser Ausfall war ein eindrucksvoller Realitätscheck. Und das zeigt: Wir sind, vielleicht mehr als wir denken, abhängig. Die Erkenntnis ist eine bittere Pille, denn ein einziger Anbieter war in der Lage, einen großen Teil des Internets für Stunden stillzulegen. Das sollte uns zu denken geben und macht deutlich, wie stark zentralisiert unser digitales Fundament inzwischen ist.





Neueste Kommentare