Il mistero del blackout dei servizi Google è stato svelato L’azienda di Mountain View ha svelato la causa dell’interruzione di servizio che per qualche ora ha messo fuori uso Gmail, Drive, Maps e YouTube: nessun attacco informatico, ma un semplice errore di configurazione di alcuni server. Pubblicato il 04 giugno 2019 da Valentina Bernocco

La notizia di un’interruzione di servizio è degna di prima pagina se la protagonista è Google, con il suo corredo di applicazioni Web di quotidiano utilizzo, come Gmail, YouTube, Maps e Drive, per citare le più importanti. Dunque grossi titoli sono stati dedicati, lunedì scorso, al blackout che per qualche ora ha reso inaccessibili i servizi di Big G in parte degli Stati Uniti, soprattutto sulla costa Est. Ne hanno risentito anche servizi collegati, come quelli di domotica di Nest, mentre il motore di ricerca Google Search ha soltanto accusato qualche rallentamento. Ma la notizia è giustamente rimbalzata in Rete, data la notorietà e l’onnipresenza dei servizi di un’azienda che si propone come un colosso del Web, dei data center e dei servizi cloud.

Ora sappiamo che cosa sia davvero successo. Nessun attacco informatico, ma un banale errore umano: come spiegato in un blogpost Benjamin Treynor Sloss, vicepresidente per le attività “24x7” di Google, una configurazione destinata a un ristretto gruppo di server è stata per sbaglio applicata a un numero più grande di macchine, distribuite su diverse regioni geografiche. E questo ha fatto sì che, nelle regioni interessate, i servizi di Google utilizzassero meno della metà della capacità di rete disponibile.

“Il traffico diretto od originato da quelle regioni”, ha scritto il vice president, “ha tentato quindi di rientrare nella capacità di rete rimanente senza però riuscirci”. A quel punto, a fronte di una rete congestionata, il sistema di reindirizzamento del traffico si è attivato nel modo corretto, per preservare i servizi a più bassa latenza a discapito degli altri, “come se portassimo a destinazione delle consegne urgenti usando la bicicletta in mezzo al peggiore degli ingorghi stradali”. Sono bastati pochi secondi agli ingegneri di Google per accorgersi del problema, mentre per la diagnosi e la risoluzione c’è voluto un po’ più di tempo. Anche perché la congestione della rete ha non solo danneggiato le prestazioni dei servizi per gli utenti, ma ha anche intralciato il lavoro degli ingegneri impegnati a riconfigurare correttamente i server.

Pur non essendosi trattato di un blackout completo, la parziale inaccessibilità dei servizi ha avuto un chiaro impatto sull’esperienza utente e, immaginiamo, sul business di Google. Tra l’inizio e la risoluzione del problema, le visualizzazioni su YouTube sono calate del 10%, il traffico dati di Google Cloud Storage è diminuito del 30%, mentre un utente Gmail su cento ha avuto difficoltà ad accedere al proprio account. Meno evidente, invece, l’impatto sul funzionamento del motore di ricerca, che ha potuto sfruttare server collocati in regioni geografiche non affette dal problema. Google ha assicurato di aver imparato la lezione e di aver, conseguentemente, innalzato i livelli di attenzione su configurazioni e dintorni. “Se siamo in torto, come accaduto domenica”, ha ammesso Sloss, “questo ci motiva a imparare il più possibile e a rendere miglioro, più veloci e più affidabili i servizi di Google”.