Microsoft uverejňuje predbežnú analýzu hlavných príčin včerajšieho veľkého výpadku Microsoft 365

Ikona času čítania 2 min. čítať


Čítačky pomáhajú podporovať MSpoweruser. Ak nakupujete prostredníctvom našich odkazov, môžeme získať províziu. Ikona popisu

Prečítajte si našu informačnú stránku a zistite, ako môžete pomôcť MSPoweruser udržať redakčný tím Čítaj viac

Exchange server

Včera Cloudové služby Microsoftu utrpeli veľký výpadok ktorú spoločnosť Microsoft pripísala nemožnosti vykonávať overovacie operácie na akýchkoľvek aplikáciách spoločnosti Microsoft a tretích strán, ktoré sú pri overovaní závislé od Azure Active Directory (Azure AD).

Táto záležitosť trvala celkovo bezprecedentných 14 hodín a znamenala, že pracovný deň bol pre mnohé spoločnosti pokazený.

Spoločnosť Microsoft dnes zverejnila predbežnú analýzu koreňových príčin, v ktorej obvinila chybu, ktorá sa vyskytla pri rotácii kľúčov používaných na podporu používania OpenID v Azure AD a iných štandardných protokolov identity pre operácie kryptografického podpisovania.

Microsoft hovorí, že ako súčasť štandardnej bezpečnostnej hygieny automatický systém na základe časového plánu odstraňuje kľúče, ktoré sa už nepoužívajú. Počas niekoľkých posledných týždňov bol konkrétny kľúč označený ako „uchovaný“ dlhšie ako normálne, aby sa podporila komplexná migrácia medzi cloudmi. To odhalilo chybu, pri ktorej automatizácia nesprávne ignorovala stav „zachovania“, čo viedlo k odstráneniu konkrétneho kľúča.

Metaúdaje o podpisových kľúčoch zverejňuje Azure AD na globálne miesto v súlade so štandardnými protokolmi Internet Identity. Po zmene verejných metaúdajov o 19:00 UTC začali aplikácie používajúce tieto protokoly s Azure AD získavať nové metadáta a prestali dôverovať tokenom/tvrdeniam podpísaným kľúčom, ktorý bol odstránený. V tom momente už koncoví používatelia nemali prístup k týmto aplikáciám.

Riešenie bolo jednoduché. Operácia odstránenia kľúča bola identifikovaná ako príčina a kľúčové metadáta boli vrátené späť do predchádzajúceho stavu o 21:05 UTC. Žiaľ, podskupina prostriedkov úložiska zaznamenala zvyškový vplyv v dôsledku metadát uložených vo vyrovnávacej pamäti a spoločnosť Microsoft potrebovala vykonať aktualizáciu, aby tieto položky zrušila a vynútila obnovenie. Tento proces bol ukončený a zmiernenie pre zákazníkov, ktorých sa to týka, bolo vyhlásené o 09:25 UTC.

Microsoft tvrdí, že má zavedené procesy na predchádzanie tejto triede rizík, no hoci už poskytuje ochranu na pridanie nového kľúča, odstránenie kľúča je naplánované len na dokončenie v polovici roka.

Spoločnosť Microsoft sa za tento problém ospravedlnila a uviedla, že neustále podniká kroky na zlepšenie platformy Microsoft Azure a svojich procesov, aby zabezpečila, že sa takéto incidenty v budúcnosti nevyskytujú.

Úplné vyšetrovanie analýzy hlavných príčin súvisiace s týmto incidentom stále prebieha a bude zverejnené, keď bude dokončené, alebo ak sa medzičasom objavia akékoľvek iné podstatné podrobnosti.

Prečítajte si všetky podrobnosti v spoločnosti Microsoft tu.

via ZDNet

Viac o témach: blankyt, microsoft