Vlákno názorů k článku Výpadek TTC ochromil 200 tisíc e-mailových schránek Seznamu od anonym - Zda se, ze vsichni skutecnost lakuji na ruzovou. Ze...

  • Článek je starý, nové názory již nelze přidávat.
  • 11. 7. 2006 15:51

    anonymní
    Zda se, ze vsichni skutecnost lakuji na ruzovou.

    Ze se prehral motorgenerator, muze se stat, nekdo nemenil filtry nebo tak neco. Ale proc po jeho vypadku spadla pretizena UPS? Vzdyt to byla ta sama UPS ktera zivila servery do startu motorgeneratoru. Tak co ji vlastne pretizilo?

    Ze se radove lisi doba vypadku priznavana Cendrou od TTC je asi folklor.

    A dostavame se k seznamu. Cekal jsem alepon Ivo rekne co se stalo tak, aby bylo jasne co se deje. Misto toho zase mlha.
  • 11. 7. 2006 17:50

    František Ryšánek (neregistrovaný)
    S velkými UPSkami krizové zkušenosti nemám, takže nemohu mluvit úplně z první ruky. Všechny UPSky jsou podle mých zkušeností dimenzovány na provoz po určitou minimální dobu: řekněme 10-20 minut. Baterie jsou vybíjeny velmi vysokým proudem v poměru ke kapacitě. Offline UPSky mají poddimenzované chladiče. Chlazení by měly mít bez problému online UPSky, což je i případ sálových UPS s výkonem řádově v desítkách kW - ale s baterkami jsou na tom velké UPSky podobně jako malé. Jednak jde o stejnou technologii akumulátorů, druhak může "velká" skříňová UPSka dokonce obsahovat hromadu klasických malých 8Ah akumulátorů, prostě protože jsou levnější a s danou kapacitou se dají snáz poskládat na odpovídající napětí a výkon.

    U malých UPSek mě nikdy nepřekvapí, když baterka lehne rychleji než by si UPSka myslela - a že už jsem to několikrát viděl.
    Inteligence malých UPSek kulhá (IQ tykve), velká UPSka by měla mít lepší odhad a hlášení poklesu napětí.

    Olověná baterka po několika letech provozu už neutáhne tolik, jako zamlada. Dodavatelé velkých UPS a stejnosměrných telekomunikačních zdrojů dnes často standardně nabízejí "bezúdržbové" zapouzdřené olověné akumulátory, a slibují jim životnost řádově 20 let (na základě katalogových listů výrobce akumulátorů), přestože daný model pochopitelně nikdo nikdy takto neotestoval - jedná se o životnost projektovanou/extrapolovanou. Drby z oboru říkají, že lepší spolehlivost je dlouhodobě dosahována s "dolévacími" bateriemi, za jejichž stav a údržbu je někdo konkrétní odpovědný. A to se bavíme o profi staničních bateriích s kapacitou v desítkách až stovkách Ah, ne o malých 8Ah cihličkách.

    Konec konců, jestliže UPSka vyčerpala skoro celou kapacitu, a pak korektně naskočil generátor, nelze míti UPSce zazlé, že to takřka okamžitě vzdala, když generátor po pár minutách zase chcípnul.

    Poznámka o stejnosměrných zdrojích, které přežily, mi připomněla vyprávění veteránů z oboru. Telekomunikační "stejnosměrný zdroj" o jmenovitém napětí -48V má pro konkrétní jmenovitý odběr (výkon) řádově větší kapacitu baterek (časovou výdrž), než srovnatelná UPSka. Můžeme to chápat jako věc tradice - stejnosměrný zdroj pro telefonní ústřednu je stavěn na delší provoz bez dobíjení, třeba až několik dní.
    Pokud jsou z takového zdroje napájeny počítače, ať už přímo nebo přes trvale běžící "střídač" (invertor) na 230V, prakticky nehrozí překvapivý okamžitý výpadek - baterie jsou vybíjeny poměrně rozumným proudem a bývají pečlivěji opatrovány údržbou, než baterie v "počítačové" UPSce.
    Pro uživatele hostingových služeb je stejnosměrný telekomunikační zdroj taková fajnová online UPSka se superdlouhou výdrží. Bohužel je to luxus i cenově.

    Cvičení krizových stavů je taky trochu problém. Třeba ten generátor: jestli ho testovali při venkovní teplotě 25C, nebo v noci při 20C, a on jim musel nakonec běžet při 33C, tak mě problém zase tolik nepřekvapuje.

    Kromě toho fatální krizový stav někdy nejde bezezbytku nasimulovat, z organizačních nebo technických důvodů. Třeba při testování RAIDu na chování v kritické situaci prakticky není možné nasimulovat širší spektrum možných závad (RAID řadič, elektronika disku, fyzická ztráta sektorů) - prakticky můžete jenom zkusit za chodu vyrvat disk a vyměnit ho za jiný. Přitom odpojení disku za chodu je prakticky poměrně nepravděpodobná závada...
  • 12. 7. 2006 8:45

    PaJaSoft
    Ehm... znate princip on-line UPS? Tedy tech pravych, ne tech, ktere se za on-line vydavaji? Pokud ano, odpovezte si na otazku, jak se muze takovato UPS "pretizit" nahodnym (kdepak se nam najednou vzal?) zvysenym odberem z vystupni vetve. A pak odpovezte na tuto otazku nam do fora, urcite by nas to zajimalo... A kupodivu i UPS maji moznost redundance veskerych komponent systemu...

    Pokud generator nabehl az po temer vybiti UPS... tak je asi neco spatne v navrhu, vidte?

    Jo a ty bezne "cihlicky" maji realnou kapacitni zivotnost do 3 let (v praxi spise 1,5-2) a to bez vyrazneho namahani (vypadek a vybiti na 50% kapacity tak 2-3x do roka).

    A centrum lze nikoli simulovat, ale realne otestovat - nejlepe pred privitanim prvniho zakaznika a pote (diky redundanci - bavime se o profesionalech, ne?) v pravidelnych intervalech testovat "po okruzich".

  • 12. 7. 2006 12:46

    J (neregistrovaný)
    Predne, v profi data centru startuje generator temer okamzite, maximalne do dvou minut. UPSka je tak na pokryti mzikoveho vypadku ale ne na to, aby udrzovala stroje v behu.

    A to nemluvim o tom, ze v zadnem pripade nesmi dojit k takovemu vybiti baterii aby se stroje nestihly korektne vypnout. Doma si muzete dovolit vypinat stroj pri 20% nebo mene, ale v data centru by melo jit vse dolu tak pri 50% aby se to bez problemu stihlo => po cca 5ti minutach provozu bez generatoru by se mely zacit stroje shazovat.

    Prave u tech profiku bych ocekaval, ze akumulatory pravidelne meni nebo alespon premeri, coz je trivialni operace. Otestovat celou UPS nebo alespon jeji jednotlive vetve neni taky nic tak sloziteho. Pri predpokladu, ze mam alespon jednu vetev jako zalozni muzu vzdy prepnout na ni a otestovat postupne celou UPS.

    => pokud to funguje jak ma, tak 2 minuty trva nez nabehne generator, kdyz umre, zbyva jeste 8 minut provozu na UPS => po dalsich 3ch minutach vydava UPS pokyn k vypnuti vsem strojum.

    Mimochodem, telefoni ustredna musi mit dostatecne zdroje k udrzeni plneho provozu po dobu 48hodin + nouzoveho provozu alespon tyden (mozna to je dokonce 14 dnu). Nouzovym provozem se rozumi odpojeni domacnosti a firem - v provozu zustavaji verejne automaty, urady, nouzove linky.
Upozorníme vás na články, které by vám neměly uniknout (maximálně 2x týdně).