Un'Estate Pessima Per Internet



Se in queste ultime settimane avete avuto la sensazione che che l'universo digitale stesse implodendo, non eravate soli.

Nell'ultimo mese ci sono state diverse ed importanti interruzioni  e malfunzionamenti della rete, che hanno colpito milioni di utenti in tutto il mondo. Siti caduti, servizi non disponibili, immagini che non si caricano,  messaggi che non si inviano, calendari ed e-mail non funzionanti per ore e ore.

È iniziato il 2 giugno - una domenica tranquilla - quando la maggior parte dei servizi ciati ha smesso di funzionare.
Un blackout massiccio di Google Cloud ha interrotto il servizio nella maggior parte della costa orientale degli Stati Uniti. Sono stati colpitivmolti siti di terze parti come Discord, Snap e Vimeo, così come molti dei servizi di Google, come Gmail e Nest.

La causa è da ricercarsi in un cambio di configurazione di routine. Il problema doveva essere isolato su pochi sistemi, ma un bug ha causato un problema a cascata su tutti i server di Google, causando il blocco dell'intero cloud per più di tre ore.

Il 24 giugno, Cloudflare ha subito un calo del 15% del suo traffico globale a causa di un'interruzione durata ore . Il gigante della rete ha accusato Verizon (la società madre di TechCrunch) .  A causa di difetti intrinseci nel border gateway protocol - che gestisce come il traffico viene instradato su internet - Verizon ha effettivamente instradato un "autostrada intera lungo una strada di quartiere" ("entire freeway down a neighborhood street"). Cloudflare ha dichiarato nel suo blog. "Questo non sarebbe mai dovuto accadere".

Anche Amazon, Linode e altre importanti aziende che dipendono dall'infrastruttura di Cloudflare si sono fermate.

Una settimana dopo, il 2 luglio, Cloudflare è stato colpito da una seconda interruzione, questa volta causata da una codifica interna.

In un post, John Graham-Cumming, Chief Technology Officer di Cloudflare, ha incolpato un parte del codice "regex" nel firewall, progettato per evitare che i siti dei suoi clienti venissero colpiti da attacchi basati su JavaScript, pe l'interruzione durata circa mezz'ora.

Tale codice ha provocato un'impennata dei processori sulle loro macchine in tutto il mondo, paralizzando di fatto l'intero servizio - e qualsiasi sito su da esso dipendente. Il ripristino del codice è stato rapido, tuttavia, e Internet è tornato rapidamente alla normalità.

Google, non volendo essere da meno, è stato colpito da un'altra interruzione il 2 luglio, a causa di alcuni danni fisici ad un cavo in fibra ottica accusati nella regione della costa orientale degli Stati Uniti. L'interruzione è durata circa sei ore, anche se Google dice che la maggior parte dell'interruzione è stata mitigata grazie all'instradamento del traffico verso gli altri data center.

Il 3 luglio, Facebook e l'intero portafoglio di servizi offerti- tra cui WhatsApp e Instagram - si è imbattuto per otto ore in un vero e proprio blackout, della rete di distribuzione di contenuti condivisi.

Facebook ha utilizzato Twitter per confermare l'interruzione del servizio.

Immagini e video non si sono caricati, lasciando dietro di logo solo uno spazio grigio con delle inquietanti descrizioni di ogni foto, generate grazie alla tecnologia "machine learning".

All'incirca nello stesso periodo, anche Twitter ha dovuto fronteggiare dei problemi inerenti ai messaggi diretti. Alcuni si lamentavano di messaggi "fantasma" altri del fatto che non funzionavano le notifiche.

Poi è arrivato il turno di Apple.

Il 4 luglio, iCloud è stato colpito da un'interruzione di tre ore, che ha interessato quasi ogni parte del suo servizio cloud-based - dall'App Store, Apple ID, Apple Pay e Apple TV. In alcuni casi, gli utenti non potevano accedere alle loro e-mail o foto basate sul cloud.

Secondo la società di vigilanza Internet ThousandEyes, l'interruzione è stata causata da un'ennesimo problema di border gateway protocol.

Cosa possiamo imparare da questa deblacle da qesta deblacle del sistema informatico?

Probabilmente, i provider dovrebbero focalizzarsi sui filtri di routing e, in secondo luogo, che forse non è una buona idea eseguire un nuovo codice direttamente su un sistema in produzione...

Queste ultime settimane non sono andate bene per il cloud, scuotendo la fiducia di coloro che dipendono dall'hosting dei giganti - come Amazon, Google e altri ancora.

Ma per la stragrande maggioranza dei consumatori e delle aziende, il cloud è ancora molto affidabile - e meglio attrezzato per gestire la sicurezza degli utenti - rispetto alla maggior parte di coloro che gestiscono i propri server all'interno dell'azienda.

La lezione appresa è facile: mai mettere tutte le uova in un solo paniere, o i tuoi dati in un'unico server cloud ;-)

 
by admin admin Date: 08-07-2019 internet blackout Facebook Google Instragram Cloudflare Apple Amazon visite : 478  
 
 
 
 

Articoli correlati