A cloudflare meg leállt

Ezt a posztot már jó pár napja írtam, így nem teljesen on-topic a téma, csak vártam kell-e a cégnek linkedin-re. Ők nem reagáltak, én meg régen írtam:

Gondolatok az elmúlt napok egyik jelentős internetes kimaradásáról: mi történik, amikor egy olyan szolgáltató, mint a Cloudflare, egyszerűen leáll.

A Cloudflare, egy komplex rendszer, ami gyorsít, optimalizál, biztonságot ad, tanúsítványt és DNS-t kezel, akár még webes védelmet is biztosít – mindent, ami kényelmesebbé teszi a weboldalak és szolgáltatások működését. Mindezt persze jól jövedelmező üzletként, ráadásul kapudrogként, a szolgáltatás alapjait ingyen is elérhetővé teszi. A szolgáltatás rendkívül jól struktúrált admin felülettel rendelkezik, intuitív és szádba rágja az elindulást. Mindenki ilyen szolgáltatásról álmodik, hiszen nem nagy mérnöki teljesítmény a felköltözés.

Szolgáltatás és/vagy probléma?

Az ilyen rendszerek mögött ugyanis rengeteg komplexitás rejlik, amit a felhasználó gyakran nem lát. DNS, BGP, tanúsítványkezelés, edge caching, proxy logika – mindezek kritikus részei a működésnek, de a modern platformok elrejtik őket, hogy minden egyszerűnek tűnjön. Felvinni valamit egy CDN-re gyerekjáték: pár kattintás, és kész a rendszer. De ha a felhő egyszer leáll, kiderül, hogy ki érti valójában, hogyan működik minden mögötte.

Az internet alapjai viszonylag egyszerűek: DNS segítségével a nevet alakítjuk IP-címmé, BGP pedig megmondja, merre található az adott cím. És amikor valaki elrontja a DNS-t vagy a BGP-t, abból hatalmas problémák születnek: a legtöbb szolgáltató már volt offline, ilyen és ehhez hasonló problémák miatt, most a Cloudflare-rel is valami hasonló történhetett. A lényeg: a szabványok, amelyek az internet működését biztosítják, ma is léteznek, de a felhőplatformok sokszor „megbabrálják” őket, hogy a felhasználó számára kényelmes legyen a szolgáltatás.

Tovább megyek, ma már az internetet leginkább a nagy, komplex felhőplatformok infrastruktúrájaként érdemes értelmezni, amelyek nem pusztán a rendszerek összekapcsolását szolgálják, hanem a felhőszolgáltatások közötti logikai és technológiai összefüggéseket – vagy éppen a hálózat komplex, néha kusza viszonyrendszerét – tükrözik.

Ez a kényelmi réteg pedig egy új jelenséget hozott: egy generáció nőtt fel úgy, hogy a felhőt (és az AI eszközöket) használja. Ők promptolni tudnak, pipeline-t összerakni tudnak, wizardokkal deploy-olni tudnak, de sokszor nem értik a mögöttes működést. Ha minden működik, minden szép, de amikor a felhő eltűnik, kiderül, ki érti a rendszert, és ki csak használja. Egyetlen szerver esetén is tudni kell, mit kell csinálni egy leállásnál, nagyobb, komplex rendszereknél pedig ez már komoly szakértelmet igényel.

Pontosan ezért van szükség akciótervre. Nem azért, mert valami biztosan elromlik, hanem mert ha a felhő bármikor kiesik, minden kattintgatós varázslat ellenére az üzlet, a szolgáltatás, a tartalom elérhetősége a mi tudásunkon múlik. Felvinni bárki tud valamit a felhőbe, visszahozni a semmiből viszont már keményebb dió. Főleg ha nemcsak egy CDN-ről beszélünk, hanem még maga a kiszolgáló is a felhős.

A felhő kényelme fantasztikus, de nem helyettesíti a tudást. Minél inkább automatizálva és leegyszerűsítve van minden, annál nagyobb az értéke annak, aki érti, mi történik a háttérben. És az igazi szakmai különbséget az jelenti, aki képes a rendszert nem csak használni, hanem újraépíteni, ha minden megszűnik.

Vélemény, hozzászólás?

Az e-mail címet nem tesszük közzé. A kötelező mezőket * karakterrel jelöltük