Po siti samozrejme, lepsejsi UPS maji sitovy modul a do serveru se nainstaluje prislusna aplikace, ktera na siti posloucha. Sit pro tuhle komunikaci muze byt oddelena. Funguje to tak, ze UPSka "vi" ktere servery jsou k ni pripojene (to se ji rekne pri konfiguraci) a pak samozrejme vi zda nektery jeste bezi ... pripadne se da nakonfigurovat pro kazdy stroj zvlast nejaky extra cas, po ktery uz neodpovida, ale UPSka ho ma jeste povazovat za bezici. Po te co jsou vsechny stroje off se muze UPSka vypnout sama (aby se nevybijely baterky).
Nic takového v datacentrech není. Vypnutí serverů je nepřípustný stav. Je to maximálně tak následek havárie.
Datová centra jsou konstruovaná k bezvýpadkovému provozu. Přeruší se napájení ze sítě, drží to UPSky po dobu, než naběhne náhradní zdroj napájení = diesel.
Vypínání serverů funguje možná někde ve firmě s UPSkou pod stolem, kde se nejedná o kritické systémy, kde stačí že se zařízení korektně vypne.
Tomu bych se tak moc nesmal. V jedne nejmenovane nemocnici a v jednom nejmenovanem meste je podobne poloutomaticke nahazovani. Nikdo neresi signalizaci z UPS a dieselagregatu na dispecink. Akorat dle normy jsou kriticke medicinske pristroje pres separatni oddelenou trafostanici.
Jedna se vetsinou o bateriova pole. Ja jsem na vlastni bulvy videl takove v telefonni ustredne. Datacentra maji imho taky takova. Jinac existuji i nebateriova reseni. Ohromne setrvacniky(proste kus tociciho se betonu) ktere jsou schopny kratkodobe vykryt ohromne vykony. Pouzivaji se i u aplikaci kde ze site nelze kratkodobe ziskat takovy vykon.
Zpochybňujete revoluci. A přitom mluvíte o stažení komunistů. :-)
Být vámi, tak zpochybňuji spíše to "stažení komunistů".
Jinak délka výpadku nebývá o délce výpadku proudu. Ale o době, než servery naběhnou. A hlavně o době, kdy se postupně zapínají jednotlivá zařízení. Protože když by se nahodila celá větev napájení, všechny zdroje v té samé vteřině naběhnou s plným odběrem. Dojde k odběrové špičce a opět to vyhodí jističe.
Proto se při takovém výpadku musí manuálně shodit různé segmenty, nebo povypínat zdroje na serverech. Nahodit přívod napájení. A pak postupně zapínat jednotlivé spotřebiče (servery).
No a pak ty servery většinou bootují docela dlouho. Kor pokud se někde musí přepočítat data na discích, kde se korektně neuložila data.
Bohajeho, taky je zas každej chytrej jak rádio. :-)
Fascinuje mě, jak ty scénáře možného průběhu si nejvíc vymýšlí ti, kteří o dané problematice asi četli maximálně ve vlaku v knížce.
1. Diesel startuje v řádu sekund od výpadku napájení. A přifázuje se maximálně v řádu desítek vteřin.
2. Diesel startuje automaticky. Ruční start se používá při zátěžových testech.
Ruční nahazování při výpadku je možné snad u nějaké kancelářské budovy, kde je ten diesel 20 let starý motor z tatrovky. :)
Proto představa .. "Hele Franto, už spadly i UPSky, tak já holt jdu nahodit diesel" je z říše pohádek.
Velke UPS (a to ty v datacentrech jsou) nemaji na vystupu konverzi ale jen stridac. Napeti baterii zhruba odpovida sitovemu. Ups pak vypada jako mistnost plna baterii seriove pospojovanych (spis serioparalelne kvuli vetsi kapacite) do vystupniho napeti a na konci toho je stridac.
Vím že zde není podobnost, ani náhodná (z hlediska použité technologie), nicméně mi váš popis připoměl jak to vypadalo v mnoha firmách těsně po "stažení se komunistů" (revolucí bych to nenazval, Češi na takové věci nejsou).
Banální výpadek proudu znamenal i hodinu nahazovat síť. Pkud došlo k pár "problikům" tak se často i musel server obnovovat ze zálohy. UPS pro běžné stanice tehdy také vydržely dodávat elektřinu jen pár minut a dobíjely se pak dlouhé hodiny (celý pracovní den)... Myslel jsem, že je to už dávná minulost.
No, neznam moc datacenter kde by meli online UPSky. Takova sranda totiz vyjde na slusnou sumicku i pro pidiserverovnu (do jednoho racku kolem 100k - mam takove dva, kazdy s 2x UPS, kazda napajena z jiny vetve, z kazdy vede napajeni do jednoho ze dvou zdroju prislusnych stroju a kazda je schopna rack udrzet sama 10 minut). Navic je treba pravidelne (a mnohem castejs) menit baterky (kdyz se na to prdi, tak muzou mit klido i 1/3 kapacity).
Nemluve o tom, ze online UPSky jsou proti prepeti (kterym telecum zduvodnuje vypadek) naprosto imunni (pokud se nebavime o par kV).
Klasicky je samo blbost dimenzovat UPS na 20 minut provozu. Vetsinou se to navrhuje na 10, s tim, ze po 1-2 minutach startuje diesel a pokud do 5 minut nenastartuje, poslou UPSky shutdown, s tim ze jak se jednotlivy stroje vypinaj a klesa odber, tak ty nejpomalejsi maj klidne 15 minut nez dojde stava.
Samo to pak taky znamena (pokud mi jde o bezpeci dat) ze po nabehu site se jeste par hodin nic nezapina, protoze se nejdriv musej ty UPSky zase nabit. Napr u meho zakaznika vypadek = min 2 hodiny (nez se nabijou UPSky).
Jinak by to pri opakovanym vypadku slo do kopru vsechno.
Obnova napájení serverů nastala ještě před nahozením rozvodné sítě. Takže:
- UPS to asi opravdu neustály (vydržely 3 minuty)
- Diesely naběhly pozdě (ono dát jim 3 minuty není moc) ale 5 minut po začátku výpadku už jely (v té době rozvodná síť ještě neběžela).
- Nahození rozvodné sítě už nic nezměnilo, vše už fungovalo
Nevis o cem mluvis
- UPS v datacentrech jsou temer jiste typy s dvojitou konverzi -v podste se TRVALE nabiji baterie a vyrabi se vystupni napeti - vypadek proudu pak neni zadne preninani ale jen se prestane nabijet. Z toho vychazi, ze nemuze dojit k nenajeti UPS protoze ty uz jedou
- v datacentrech neni nic jako vypinani serveru pri vypadku proudu - jede se z UPS, kterych je minimalne N+1 (pro provoz jsou potreba 4 tak je jich tam 5), ups zajistuji provoz na par minut a potom je zaskakuji dieselagregaty (zase jich je N+1). Pokud tedy dojde k takovemuhle blackoutu v datacentru je to vetsinou nepredvidatelna situace a neni sance nic vypnout (pravdepodobnost ze nenajedou diesely ktere se pravidelne testuji, udrziji se v predehratem stavu... je minimalni)
Pravdepodobne se jedna o souhru dvou poruch nebo nejakeho nestandardniho provozniho stavu (na jedne z UPS zrovna probihal servis a nejaka druha neustala prepeti, v jednom dieselu se menil olej a druhy selhal...) pripadne o reakci nejakych ochran ZA UPSkama
Pokud by totiz po vypadku elektriny najely UPS, tak v okamziku toho "prepeti" by vse jelo na UPS a UPSka z principu neco takovyho odfiltruje. Navic kazdej spotrebic zvladne urcite +30% (dlouhodobe, kratkodobe mnohem vic).
Spis to vypada, ze jim UPSky nenajely, nebo jen z casti => servery to misto za proklamovanych 20 minut vysaly za 3 (to by odpovidalo tem 3 minutam po kterych zaznamenaly vypadek proti rozvodne) a pak to jednoduse zdechlo, protoze za 3 minuty se vetsina serveru korektne vypnout nestihne.
No a v dalsi etape bych to videl tak, ze jelikoz se servery nevyply korektne, tak zustaly ve stavu "zapnuto" => po nabehu napajeni jim to parkrat vyrazilo jistice => nekdo tam musel vyrazit poodpojovat cast serveru aby se to zapinalo postupne.
No a kdyz to zaclo konecne vsechno startovat, tak se vzhledem k nekorektnimu vypnuti zacly spoustet veci jako fschk a spol, coz muze klido bezet i nekolik hodin ...