Microsoft postează o analiză preliminară a cauzei principale pentru întreruperea majoră a Microsoft 365 de ieri

Pictograma timp de citire 2 min. citit


Cititorii ajută la sprijinirea MSpoweruser. Este posibil să primim un comision dacă cumpărați prin link-urile noastre. Pictograma Tooltip

Citiți pagina noastră de dezvăluire pentru a afla cum puteți ajuta MSPoweruser să susțină echipa editorială Află mai multe

Server de schimb

Ieri Serviciile cloud ale Microsoft au suferit o întrerupere majoră pe care Microsoft l-a atribuit incapacității de a efectua operațiuni de autentificare pe orice aplicație Microsoft și terță parte care depind de Azure Active Directory (Azure AD) pentru autentificare.

Problema a durat în total 14 ore fără precedent și a însemnat că ziua de lucru a fost răsfățată pentru multe companii.

Astăzi, Microsoft a postat o analiză preliminară a cauzei care a dat vina pe o eroare care a apărut în rotația cheilor utilizate pentru a sprijini utilizarea de către Azure AD a OpenID și a altor protocoale standard Identity pentru operațiunile de semnare criptografică.

Microsoft spune, ca parte a igienei standard de securitate, un sistem automatizat, pe un program bazat pe timp, elimină cheile care nu mai sunt utilizate. În ultimele câteva săptămâni, o anumită cheie a fost marcată ca „reține” pentru mai mult timp decât în ​​mod normal, pentru a sprijini o migrare complexă între cloud. Acest lucru a expus o eroare în care automatizarea a ignorat în mod incorect acea stare de „reținere”, ceea ce a determinat-o să elimine respectiva cheie.

Metadatele despre cheile de semnare sunt publicate de Azure AD într-o locație globală, în conformitate cu protocoalele standard de identitate Internet. Odată ce metadatele publice au fost modificate la ora 19:00 UTC, aplicațiile care foloseau aceste protocoale cu Azure AD au început să preia noile metadate și au încetat să mai aibă încredere în jetoane/aserțiuni semnate cu cheia care a fost eliminată. În acel moment, utilizatorii finali nu mai puteau accesa acele aplicații.

Soluția a fost simplă. Operația de eliminare a cheii a fost identificată ca fiind cauza, iar metadatele cheii au fost aduse înapoi la starea anterioară la 21:05 UTC. Din păcate, un subset de resurse de stocare a experimentat un impact rezidual din cauza metadatelor stocate în cache, iar Microsoft a trebuit să impulsioneze o actualizare pentru a invalida aceste intrări și a forța o reîmprospătare. Acest proces a fost finalizat și atenuarea pentru clienții afectați rezidual a fost declarată la 09:25 UTC.

Microsoft spune că are procese în vigoare pentru a preveni această clasă de riscuri, dar deși oferă deja protecții pentru adăugarea unei noi chei, componenta de eliminare a cheii este programată să fie finalizată abia la jumătatea anului.

Microsoft și-a cerut scuze pentru problemă și a spus că iau în mod continuu măsuri pentru a îmbunătăți Platforma Microsoft Azure și procesele acestora pentru a se asigura că astfel de incidente nu vor avea loc în viitor.

O investigație completă a analizei cauzei rădăcină referitoare la acest incident este încă în desfășurare și va fi publicată când va fi finalizată sau dacă vor apărea alte detalii substanțiale între timp.

Citiți toate detaliile la Microsoft aici.

de ZDNet

Mai multe despre subiecte: azur, microsoft