20/11/2014 di Redazione

Storage su Azure inagibile per ore, tutta colpa di un update

Microsoft ha spiegato nel dettaglio le ragioni che, martedì scorso, hanno causato per quasi undici ore l’interruzione di servizi poggiati sul cloud di Azure in Europa, Stati Uniti e Asia. Qualcosa è andato storto durante una procedura di aggiornamento, di

immagine.jpg

Buone intenzioni, pessimi risultati: nel tentativo di migliorare alcuni livelli di performance della piattaforma Azure, Microsoft ha “pasticciato”, rendendo inagibili molti servizi per quasi undici ore. È successo due giorni fa e ora l’azienda di Redmond, in un blogpost a firma di Jason Zander (Cvp del team di Azure), ne spiega le cause, sottolineando le proprie buone intenzioni: tutta colpa di un update, condotto con una procedura forse un po’ rischiosa. Ovvero con un roll out esteso all’Europa, agli Stati Uniti e all’Asia in contemporanea anziché scandito in tempi diversi.

“All’interno di un aggiornamento di performance di Azure Storage”, scrive Zander, “abbiamo rilevato un problema che riduceva la capacità dei servizi che utilizzano Azure Storage, incluse macchine virtuali, Visual Studio Online, siti Web, servizi di ricerca e altri di Microsoft”. Microsoft sottolinea di aver testato per molte settimane l’update prima di installarlo (attraverso una procedura chiamata flighting), e tuttavia durante il rollout è stato scoperto un problema che ha mandato in tilt Azure in tutte e tre le regioni geografiche.

“Appena scoperto il problema”, spiega Zander, “la modifica è stata immediatamente ritirata, ma per annullare completamente l’update gli utenti hanno dovuto riavviare i loro sistemi. Una volta rilasciate le mitigazioni, la maggior parte di nostri clienti in tutte le regioni ha cominciato a notare miglioramenti di disponibilità”. La gran parte dei servizi è ora tornata online.

Tutto bene quel che finisce bene? Non troppo, perché eventi di questo tipo non sono mai una buona pubblicità per chi voglia fare leva sui concetti di disponibilità, performance e affidabilità del cloud. Fra l’altro, un episodio simile lo scorso luglio aveva coinvolto proprio la piattaforma Azure. Microsoft, in ogni caso, ha detto di essere già al lavoro per “esaminare nel dettaglio che cosa sia andato storto e assicurarsi che non accada più”.

ARTICOLI CORRELATI