Článek
Výpadek cloudové služby Amazon Web Services (AWS) zapříčinil problémy stovek aplikací a stránek, mezi nimi je například firmami často používaný Slack, Zoom, Canva, Fortnite, Duolingo nebo oblíbená sociální síť Snapchat. Řada z nich vůbec nefungovala. Odpoledne Amazon uvedl, že vyřešil hlavní problém, ale že menší potíže mohou ještě přetrvávat. Také zasažené služby a weby postupně hlásí návrat k normálu.
Společnost začala poprvé potíže prošetřovat už v neděli večer středoevropského času, větší rozsah problému připustila dnes kolem 10:30 SELČ. Po poledni už hovořila o postupném zotavování služeb. „Nadále pracujeme na úplném vyřešení problému a budeme poskytovat aktuální informace, jakmile budeme mít k dispozici více informací,“ dodala společnost. Následně po 13:00 SELČ uvedla, že větší část problému vyřešila, ale že stále mohou přetrvávat potíže s kapacitou.
Web Downdetector, který sleduje stížnosti na nefunkční weby, zaznamenal více než čtyři miliony zpráv od uživatelů a problémy mělo přes 500 společností. Mimo jiné i banky, včetně Halifaxu, Lloyds a Bank of Scotland, které jsou podle serveru The Independent součástí stejné mateřské společnosti. Jejich klienti zmiňují problémy s internetovým bankovnictvím.
Podle BBC nefungovala ani webová stránka britského daňového úřadu HMRC. „Jsme si vědomi toho, že zákazníci mají problémy s přístupem k našim online službám v rámci globálních problémů ovlivňujících webové služby Amazon. Na této záležitosti s nimi pracujeme,“ sdělil mluvčí britského daňového úřadu BBC.
Mezi postiženými weby a službami podle stanice CNBC byly také streamovací platforma Disney+, deník The New York Times, internetové diskuzní fórum Reddit nebo telefonní operátor T-Mobile.
Někteří zákazníci amerických aerolinek United Airlines a Delta Air Lines na sociálních sítích hlásili, že nemohou najít své rezervace online, odbavit se nebo odevzdat zavazadla.
Uživatelé podle Downdetectoru hlásili problémy také na britských vládních stránkách Gov.uk. Mluvčí řekl, že vláda o problému ví a je v kontaktu se společností, „která pracuje na co nejrychlejším obnovení služeb“, citoval ho server CNBC.
Další podnik, kterého se výpadek dotkl, byly National Rail, britské sdružení privatizovaných železničních společností. „Kvůli problémům s naším poskytovatelem infrastruktury jsme dnes ráno zaznamenali pomalejší a obtížnější načítání stránek a aplikace National Rail.“
Server The Independent zmiňuje, že nic nenasvědčuje tomu, že by se jednalo o kybernetický útok. Podobné výpadky jsou totiž časté a většinou za ně může fyzický problém v datovém centru, špatná změna v nastavení nebo pokažená aktualizace. I Amazon uvádí, že se jedná o technický problém. „Identifikovali jsme potenciální příčinu chybovosti API DynamoDB v regionu US-EAST-1. Na základě našeho šetření se zdá, že problém souvisí s DNS rozlišením koncového bodu API DynamoDB v regionu US-EAST-1,“ upřesnil Amazon.
„Pokračujeme v práci na úplném odstranění chyb spouštění EC2, které se mohou projevovat jako chyba nedostatečné kapacity. Kromě toho pokračujeme v práci na zmírnění zvýšených zpoždění dotazování pro Lambda, konkrétně pro Lambda mapování zdrojů událostí pro SQS. Aktualizaci poskytneme do 5:00 PDT (14 hodin),“ doplňuje Amazon.
Výpadek podle datového ředitele technologické skupiny Creative Dock Adama Hanky zasáhl i české uživatele. "Všechny aplikace či weby, které běží částečně nebo kompletně na infrastruktuře AWS v postižených regionech, mohly zaznamenat výpadky nebo zpomalení. Nicméně je pravděpodobné, že část českého internetu zůstala netknuta. Dopad tedy nebyl univerzální, ale selektivní, a závisel na infrastruktuře konkrétní služby.
Výpadek, který postihl desítky významných webů a aplikací, je podle Hanky typickým příkladem takzvaným cascade failure v cloudu, tedy selhání jedné klíčové komponenty, které spustilo dominový efekt, kdy se klíčové mikroservisy nemohly připojit, a zákaznické služby zkolabovaly. „Takové incidenty nejsou nutně výsledkem kybernetického útoku, jak se často spekuluje. Amazon sám uvedl, že šlo o technickou závadu, nikoli o zlovolný vnější zásah,“ podotkl.
Organizace by podle expertů bezpečnostní firmy Check Point neměly spoléhat na jedno cloudové prostředí, ale zvážit použití několika různých systémů. Zároveň je nutné záložní systémy průběžně testovat, proškolovat týmy a připravit se na výpadky dřív, než k nim dojde. Protože když se společnosti snaží rychle obnovit systémy a přístup, zaměstnanci jsou přetížení, a právě v tu chvíli útočníci mohou udeřit. Ve stresu a pod časovým tlakem se zvyšuje šance na chybu a že útok bude úspěšný, uvedl Check Point v komentáři.
Nejednalo se o první velký výpadek internetových služeb. První byl v prosinci 2020, kdy služby poskytované Googlem nefungovaly cca 90 minut. Další byl v červenci 2021, kdy nefungoval Amazon, Reddit, Spotify a několik zpravodajských webů, v říjnu téhož roku nefungoval Facebook, Instagram a WhatsApp téměř šest hodin.
Výpadek je tak rozsáhlý, protože AWS poskytuje cloudové služby pro velké procento webových stránek i aplikací, upozorňuje BBC. Jejich klienty jsou velké firmy, jednotlivci, ale i vlády. Konkurenty AWS jsou Google a Microsoft.

















