Όταν "πέφτει" το Internet: Πόσο εύθραυστο είναι το παγκόσμιο cloud;

Τεχνολογία
Δημοσιεύθηκε  · 5 λεπτά ανάγνωση

Το “έπεσε το Internet” δεν υφίσταται πια με τον τρόπο που το γνωρίζαμε. Αυτό που συμβαίνει είναι ότι το “έφαγε” το cloud, το οποίο ελέγχεται από τέσσερις εταιρείες από τις οποίες εξαρτάται άμεσα η συνδεσιμότητά μας με αμέτρητες σελίδες και εφαρμογές.

Ενώ το Internet παραμένει ένα δίκτυο δικτύων, που σημαίνει ότι αν ένα τμήμα “πέσει”, τα άλλα συνεχίζουν να λειτουργούν καλύπτοντας το κενό, η πραγματικότητα είναι πως το 80% με 90% των υπηρεσιών που χρησιμοποιούμε στο διαδίκτυο καθημερινά, “τρέχουν” από αυτές τις τέσσερις εταιρείες. Επομένως, ένα πρόβλημα σε μία, επηρεάζει άμεσα όλους εμάς.

Όλα τα “αυγά” έχουν μπει σε λίγα καλάθια. Πιο συγκεκριμένα, σε τρία καλάθια: Amazon Web Services, Google Cloud Platform και Microsoft Azure, τα οποία μαζί “κρατούν” το 63% όλων των cloud servers του κόσμου, σύμφωνα με το CRN.

Υπάρχουν και μικρότερες εταιρείες, όπως το Oracle Cloud που “φιλοξενεί” το ChatGPT (3%) και το Alibaba Cloud (4%). Η Big 3, μαζί με την Cloudflare (μεσολαβητής μεταξύ χρήστη και server, που “χειρίζεται” το 21% της κίνησης, σύμφωνα με την ίδια την εταιρεία), είναι υπεύθυνες για το 84% της παγκόσμιας κάλυψης.

Η αμερικανική εταιρεία Cloudflare, λειτουργεί ως μεσολαβητής για sites και εφαρμογές, διαχειρίζεται την ασφάλεια και την απόδοση των ιστοσελίδων και των υπηρεσιών τους. Αυτή η υπερσυγκέντρωση σε λίγους cloud providers έχει καταστήσει το “σύννεφο” το πιο ευάλωτο σημείο του σύγχρονου Internet και τον κύριο λόγο που βλέπουμε μπροστά μας λευκές και μπλε οθόνες.

Αυτό που έγινε αντιληπτό είναι το πόσο λανθασμένη είναι η φράση “έπεσε το Internet”. Διότι ενώ πολλά επιμέρους στοιχεία μπορεί να πέσουν, είναι εξαιρετικά σπάνιο να καταρρεύσει ολόκληρο το δίκτυο.

Για να κατανοήσουμε πόσο εύκολο ή δύσκολο είναι να μείνουμε χωρίς Internet για μέρες λόγω cloud, πρέπει να διευκρινιστούν κάποια πράγματα. Όταν χρησιμοποιούμε μια εφαρμογή ή ένα site, όπως το ChatGPT, ακολουθεί μια σειρά ενεργειών μέσα σε ένα δευτερόλεπτο. Το κινητό στέλνει το μήνυμα ότι θέλουμε να μπούμε εκεί, το οποίο φεύγει από το Wi-Fi μας και πάει στον πάροχο Internet. Από εκεί πηγαίνει στον παγκόσμιο ιστό.

Το Cloudflare, με server κοντά στην τοποθεσία μας, πιστοποιεί ότι είμαστε άνθρωποι και όχι bot, κρυπτογραφεί την κίνηση (HTTPS) και προωθεί το αίτημα στην Microsoft Azure, τον cloud provider του ChatGPT. Οι servers της Azure, σε διάφορες χώρες της Ευρώπης και στις ΗΠΑ, επεξεργάζονται το μήνυμα και το δίνουν στο μοντέλο τεχνητής νοημοσύνης, το οποίο απαντά.

Η απάντηση φτάνει σε εμάς, αφού η Azure τη στείλει στο Cloudflare, που φορτώνει γρήγορα τη σελίδα και μας τη στέλνει με ασφάλεια. Όλες αυτές οι “διαδρομές” γίνονται σε ένα δευτερόλεπτο.

Εάν επιχειρήσουμε να μπούμε στο ChatGPT και εμφανιστεί Error 502/503 και Bad gateway, φταίει το Cloudflare. Εάν εμφανιστεί Internal Server Error ή Something Went Wrong ή μια άσπρη σελίδα, φταίει η Microsoft. Εάν δεν υπάρχει καμία ανταπόκριση, φταίνε και οι δύο.

Το πρόβλημα του Cloudflare χαρακτηρίστηκε ως widespread 500 errors και αποδείχθηκε ότι ήταν ένα τεχνικό λάθος σε ένα αυτοματοποιημένο σύστημα που μεγάλωσε υπερβολικά και τελικά “έσκασε”. Ουσιαστικά, έφταιγαν οι άνθρωποι που δεν προνόησαν να “μάθουν” στο μηχάνημα να ελέγχει το όριο μεγέθους αρχείων.

Η μεγάλη συγκέντρωση του ελέγχου του Internet σε τέσσερις εταιρείες σημαίνει ότι οποιοδήποτε πρόβλημα σε μία από αυτές μπορεί να “γονατίσει” τον κόσμο. Αυτός είναι ο πρώτος κίνδυνος, δεδομένου ότι δεν υπάρχει εύκολα εναλλακτική, λόγω περιορισμών που εμποδίζουν νέους providers.

Την Τρίτη, “χάλασε” η μπροστινή πόρτα για εκατομμύρια sites, δηλαδή το Cloudflare. Φανταστείτε τι θα γίνει αν “χαλάσει” ένας από τους 3 κύριους cloud providers. Πόσο εύκολο είναι αυτό να συμβεί;

Πέρα από τις κυβερνοεπιθέσεις και τους γεωπολιτικούς κινδύνους, μια από τις κύριες απειλές είναι το Single Point of Failure, δηλαδή να “πέσει” ένας μεγάλος provider, έστω και για λίγα λεπτά. Όπως ανέφερε και η Guardian, τον Οκτώβριο έπεσε το Amazon Web Services us east 1 (στη Βιρτζίνια) και ταλαιπώρησε πάνω από 1.000 εταιρείες και εκατομμύρια χρήστες.

Το πρόβλημα αποδόθηκε στο Σφάλμα Συστήματος Ονομάτων Τομέα (DNS). Το BBC διευκρίνισε πως το DNS λειτουργεί σαν χάρτης. Όταν κάποιος πατάει μια εφαρμογή ή κάνει κλικ σε σύνδεσμο, η συσκευή στέλνει το αίτημα για σύνδεση στο Σύστημα Ονομάτων Τομέα. «Η AWS έχασε τον προσανατολισμό της και ενώ “έβλεπε” τις πλατφόρμες, δεν μπορούσε να δει πού βρίσκονταν για να κατευθύνει την επισκεψιμότητα σε αυτές».

Αυτό το σφάλμα συμβαίνει για διάφορους λόγους, όπως προβλήματα συντήρησης, βλάβη διακομιστή ή ανθρώπινο λάθος. Σε ακραίες περιπτώσεις, μπορεί να είναι και κυβερνοεπίθεση.

Mια άλλη απειλή είναι η αλυσιδωτή αντίδραση, δηλαδή η εξάπλωση βλάβης, όπως έγινε πέρυσι με την CrowdStrike. Τον Ιούλιο του 2024, μια ενημέρωση σε λογισμικό ασφαλείας για Windows οδήγησε σε blackout 8.5 εκατομμυρίων υπολογιστών σε όλον τον κόσμο για 62 λεπτά.

Πτήσεις ακυρώθηκαν, χειρουργικές επεμβάσεις αναβλήθηκαν, κολοσσοί όπως η Alphabet, η Amazon και η Intel παρέλυσαν, όπως και η κυβέρνηση των ΗΠΑ, τηλεοπτικά δίκτυα “έριξαν” μαύρο και οθόνες εμφάνισαν την “μπλε οθόνη του θανάτου”. Οι ζημιές εκτιμήθηκαν από το Harvard Business Review σε 5 δισεκατομμύρια δολάρια.

Αν και δεν πρόκειται για επίθεση, αλλά για αναβάθμιση σε λογισμικό που ανιχνεύει και αντιμετωπίζει απειλές, οι συνέπειες ήταν τεράστιες. Γίνονται συχνά μελέτες για τις πιθανότητες παγκόσμιας κατάρρευσης του Internet για μέρες ή μήνες, οι οποίες δείχνουν πως είναι εξαιρετικά χαμηλές, κάτω του 1% ετησίως.

Ωστόσο, οι μερικές ή τοπικές διακοπές αυξάνονται λόγω της υπερσυγκέντρωσης των υπηρεσιών σε λίγους cloud providers, με την κλιματική κρίση και τα γεωπολιτικά να επιδεινώνουν το πρόβλημα. Μια κοινή μελέτη των Munich Re–CyberCube εκτιμά ότι ένα ακραίο σενάριο κυβερνοεπίθεσης, μέσω cloud θα μπορούσε να μολύνει έως και το 25% των παγκόσμιων cloud συστημάτων, με διάρκεια διακοπής τις περισσότερες φορές κάτω από 72 ώρες, αλλά σε ακραίες περιπτώσεις και πάνω από μία εβδομάδα.

Θα αντέξεις;