My tedy nahazovali DA každý týden. A střídalo se nahození se zátěží a bez zátěže. Ale kdo jsem já, abych radil takovým velkým datacentrům. :-)
Nám na tom jel jen centrální bod telekomunikační sítě v hlavním našem datacentru, jedna kolokace a jeden sál pro zákazníky. :-)
Ale stejně mě fascinuje, jak skoro s každým podobným větším výpadkem energie spadne nějaké velké datacentrum, protože něco co mělo být redundantní, selže.
U České televize a Českého rozhlasu je výhoda, že předmětem jejich činnosti je rozhlasové a televizní vysílání, které fungovalo. Dokonce fungovalo i iVysílání. Ostatní webové stránky už beru jako nadstavbu.
Takovýto velký výpadek rozvodny je třeba brát jako "středně ostré cvičení", které se ještě dá zvládnout a poskytne mnoho důležitých informací ke zlepšení. Horší by to bylo v nějaké krizové situaci.
čím větší firma tím více víry, že HW za miliony vždy pojede zcela ok a naběhne skutečně pokaždé kdy bude potřeba... jak často se má takový HW testovat, minimálně 1x za půl roku ? Na méně významných objektech ČRa, kde je diesel se testovalo určitě 1x za půl roku, u data center takove velikosti by to mělo být snad co měsíc.
HW = dieselgenerátor :o)
Jenze tam hlavne podle vseho odesla jedna z UPS... a mimochodem ani CRA se ty podobne nevyhnuly. Ono to neni jen o testech dieselagregatu :-) Je to technika a ta proste muze selhat i kdyz se pravidelny servis nepodceni...
je to prostě dost těžká disciplína. S 10 racky to také umím testovat každý týden, ale zajistit to v celém DC, kde mám část zařízení pouze na jedné větvy je trochu složitější. Výhodu mají ti, kteří těch DC mají spousty a mohou si to postupně zkoušet a ladit, tyhle jedno/dvou datacentrové společnosti jsou odkázání na papír a tužku, pak může něco selhat.
Výpadky masteru byly v jednotkách hodin, najíždělo střídavě a postupně. To, že irozhlas a jiní z toho udělali celý den je věc jiná a jde to vesměs na jejich bedra.
Ty kontejnery obvykle konci u UPS, ne? (aspon co si vybavuju u techto reseni od Altronu ci Contegu). A nutne dalsi kontejner(y) je ten agregat... no a pak asi i nejaky ty trafa, zejo. Aneb zalezi, kam az chceme s tou redundanci jit... znacka ideal jsou privody 22kV ze dvou smeru, ale to stoji uz slusny ranec penez a ne vsude je to mozne. A on ani dohled tehlech veci neni uplne trivialni - u mnohych zarizeni by soucasnym "vyvojarum" spise vybouchla hlavicka (z legacy protokolu typu modbus, kde co vendor, to jinak poskladane) :-)
Ono se testuje takhle naprazdno, bez zatizeni? Predstavoval jsem si, ze se proste pri testu vypne napajeni ;)
Ale abych se tak nedivil. U nas v praci se kazdy tyden testuje zalozni vzduchovy kompresor. Vzdy se nahodi, necha chvili bezet. A vzdy OK. Az do okazmiku, kdy byl opravdu potreba a zjistilo se, ze mu nefunguje regulace vykonu ;)
Podle jejich vyjadreni testovali pred cca mesicem. Wedos myslim kdysi dojel na to, ze testoval agregat sice pravidelne, ale naprazdno a pod zatezi se jim prakticky okamzite prehral. Nemyslim si, ze Master tuto chybu zopakoval, obvzlast proto, ze jedna vetev se cele rano drzela a ani nezminili, ze by jim vubec vypadla. Pravdepodobně standardne berou z obou vetvi a bud to maji spatne nadimenzovane nebo to nesplnilo ocekavani. Nemyslim si ze veskery instalovany HW ma dva zdroje, takze by to treba ani neslo testovat bez vypadku ...
jsou tady určité kritické části infrastruktury, které vyžadují stavění takhle malých DC, ano je to relativně drahé, ale něco prostě nelze centralizovat. Jinak u nás se poměrně úspěšně skládají kontejnerová DC a vyváží se, to vlastně je ten podobný případ, dohled lze pak centralizovat, ale provoz samotný máš oddělené a distrubovaný.
Tak na základě toho co se dělo, by to chtělo takových blackoutů více, aby se postižení zpamatovali a plánovali opravdu funkční záložní infrastrukturu a opravdu to pravidelně testovali... čezská robustní elektrická síť bez výpadků znamená defakto spánek na vavřínech.
7. 6. 2022, 01:39 editováno autorem komentáře