Časť 1.
Úvod
Vývoj moderného vybavenia sa vyznačuje výrazným zvýšením jeho zložitosti. Zvyšujúca sa komplexnosť vedie k zvýšeniu garancie včasnosti a správnosti riešenia problémov.
Problém spoľahlivosti nastal v 50-tych rokoch, keď sa začal proces rýchlej komplikácie systémov a začali sa uvádzať do prevádzky nové objekty. V tomto čase sa objavili prvé publikácie definujúce pojmy a definície súvisiace so spoľahlivosťou [1] a vznikla metodika hodnotenia a výpočtu spoľahlivosti zariadení pomocou pravdepodobnostných a štatistických metód.
Štúdium správania sa zariadenia (objektu) počas prevádzky a posudzovanie jeho kvality určuje jeho spoľahlivosť. Pojem „vykorisťovanie“ pochádza z francúzskeho slova „vykorisťovanie“, čo znamená získať prospech alebo prospech z niečoho.
Spoľahlivosť je vlastnosť objektu vykonávať špecifikované funkcie a udržiavať v priebehu času hodnoty stanovených prevádzkových ukazovateľov v rámci stanovených limitov.
Na kvantifikáciu spoľahlivosti objektu a na plánovanie prevádzky sa používajú špeciálne charakteristiky - ukazovatele spoľahlivosti. Umožňujú posúdiť spoľahlivosť objektu alebo jeho prvkov v rôznych podmienkach a v rôznych fázach prevádzky.
Podrobnejšie informácie o indikátoroch spoľahlivosti nájdete v GOST 16503-70 - "Priemyselné výrobky. Nomenklatúra a charakteristiky hlavných ukazovateľov spoľahlivosti.", GOST 18322-73 - "Systémy údržby a opráv zariadení. Termíny a definície.", GOST 13377- 75 - "Spoľahlivosť v technológii. Termíny a definície."
Definície
Spoľahlivosť- vlastnosť [ďalej - (jeho)] objektu [ďalej - (OB)] vykonávať požadované funkcie, pričom si zachováva svoje ukazovatele výkonnosti počas daného časového obdobia.
Spoľahlivosť je komplexná vlastnosť, ktorá spája koncepty prevádzkyschopnosti, spoľahlivosti, životnosti, udržiavateľnosti a bezpečnosti.
Výkon- predstavuje stav OB, v ktorom je schopný vykonávať svoje funkcie.
Spoľahlivosť- schopnosť OB zachovať si svoju funkčnosť po určitú dobu. Udalosť, ktorá naruší činnosť OB, sa nazýva porucha. Zlyhanie, ktoré sa vyrieši samo, sa nazýva zlyhanie.
Trvanlivosť- voľnosť OB udržať si prevádzkyschopnosť do medzného stavu, keď sa jeho prevádzka stane nemožnou z technických, ekonomických dôvodov, bezpečnostných podmienok alebo potreby väčších opráv.
Udržiavateľnosť- určuje prispôsobivosť zariadenia na prevenciu a zisťovanie porúch a porúch a ich odstraňovanie prostredníctvom opráv a údržby.
Skladovateľnosť- schopnosť OB nepretržite udržiavať svoju výkonnosť počas a po skladovaní a údržbe.
Hlavné ukazovatele spoľahlivosti
Hlavnými kvalitatívnymi ukazovateľmi spoľahlivosti sú pravdepodobnosť bezporuchovej prevádzky, poruchovosť a stredná doba do poruchy.
Pravdepodobnosť bezporuchovej prevádzky
P(t) predstavuje pravdepodobnosť, že v rámci určeného časového obdobia t, porucha OB nenastane. Tento ukazovateľ je určený pomerom počtu prvkov OB, ktoré do daného bodu fungovali bez poruchy t k celkovému počtu prvkov OB funkčných v počiatočnom momente.
Poruchovosť l(t) je počet porúch n(t) OB prvky za jednotku času, vztiahnuté na priemerný počet prvkov Nt OB je momentálne v prevádzke Dt:
l (t) = n (t)/(Nt * Dt)
, Kde
D
t- určené časové obdobie.
Napríklad: 1000 OB prvkov pracovalo 500 hodín. Počas tejto doby zlyhali 2 prvky. Odtiaľ, l(t)= n(t)/(Nt*Dt)=2/(1000*500)=4*10-6
1/h, t.j. 4 z milióna prvkov môžu zlyhať za 1 hodinu.
Ukazovatele poruchovosti komponentov sa berú na základe referenčných údajov [1, 6, 8]. Uvádza sa napríklad miera zlyhania l(t) niektoré prvky.
Názov položky |
Poruchovosť, *10 -5, 1/h |
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Rezistory |
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Kondenzátory |
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Transformátory |
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Induktory |
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Spínacie zariadenia |
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Spájkované spoje |
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Drôty, káble |
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Elektromotory |
Spoľahlivosť OB ako systému je charakterizovaná tokom porúch L, ktoré sa číselne rovná súčtu poruchovosti jednotlivých zariadení: L = ål i Vzorec vypočítava tok porúch a jednotlivé OB zariadenia, ktoré sa zase skladajú z rôznych celkov a prvkov, charakterizovaných svojou poruchovosťou. Vzorec je platný pre výpočet poruchovosti systému z n prvkov v prípade, keď porucha niektorého z nich vedie k zlyhaniu celého systému ako celku. Toto spojenie prvkov sa nazýva logicky konzistentné alebo základné. Okrem toho dochádza k logicky paralelnému spojeniu prvkov, kedy porucha jedného z nich nevedie k zlyhaniu systému ako celku. Vzťah medzi pravdepodobnosťou bezporuchovej prevádzky P(t) a poruchovosť L definované: P (t )= exp (- Dt ) , to je jasné 0 A 0<
P
(t
)<1
A p(0)=1, A p (¥) = 0
Výpočet spoľahlivosti
|
V štádiu približných a približných výpočtov elektrických zariadení sa vypočítajú hlavné ukazovatele spoľahlivosti .
Hlavné kvalitatívne ukazovatele spoľahlivosti sú:
Poruchovosť
Priemerný čas do zlyhania.
Poruchovosť l (t)- to je počet tých, ktorí odmietli n(t) prvkov zariadenia za jednotku času vo vzťahu k priemernému celkovému počtu prvkov N(t), v tom čase v prevádzke Δ t[ 9]
l (t)=n(t)/(Nt*Δt) ,
Kde Δt- určené časové obdobie.
Napríklad: 1000 prvkov zariadenia pracovalo 500 hodín. Počas tejto doby zlyhali 2 prvky. Odtiaľ,
l (t)=n(t)/(Nt*Δt)=2/(1000*500)=4*10-6 1/hod, to znamená, že za 1 hodinu môžu zlyhať 4 prvky z milióna.
Indikátory poruchovosti l (t) prvky sú referenčné údaje, v prílohe D sú uvedené miery zlyhania l (t) pre prvky často používané v obvodoch.
Elektrické zariadenie pozostáva z veľkého počtu komponentov, preto sa určuje prevádzková poruchovosť l (t) celého zariadenia ako súčet poruchovosti všetkých prvkov podľa vzorca [11]
kde k je korekčný faktor, ktorý zohľadňuje relatívnu zmenu priemernej poruchovosti prvkov v závislosti od účelu zariadenia;
m – celkový počet skupín prvkov;
n i - počet prvkov v i-tej skupine s rovnakou poruchovosťou l i (t).
Pravdepodobnosť bezporuchovej prevádzky P(t) predstavuje pravdepodobnosť, že v rámci určeného časového obdobia t, nedôjde k poruche zariadenia. Tento ukazovateľ je určený pomerom počtu zariadení, ktoré do daného bodu fungovali bez poruchy t k celkovému počtu zariadení v prevádzke v počiatočnom momente.
Napríklad pravdepodobnosť bezporuchovej prevádzky P(t)=0,9 predstavuje pravdepodobnosť, že v určenom časovom období t= 500 hodín dôjde k poruche na (10-9=1) jednom zariadení z desiatich a z 10 zariadení bude 9 fungovať bez poruchy.
Pravdepodobnosť bezporuchovej prevádzky P(t)=0,8 predstavuje pravdepodobnosť, že v určenom časovom období t=1000 hodín dôjde k poruche na dvoch 2 zariadeniach zo sto a zo 100 zariadení bude 80 zariadení fungovať bez poruchy.
Pravdepodobnosť bezporuchovej prevádzky P(t)=0,975 predstavuje pravdepodobnosť, že v určenom časovom období t=2500 hodín dôjde k poruche u 1000-975=25 zariadení z tisíc a 975 zariadení bude fungovať bez poruchy.
Kvantitatívne sa spoľahlivosť zariadenia hodnotí ako pravdepodobnosť P(t) udalosti, že zariadenie bude vykonávať svoje funkcie bez poruchy v čase od 0 do t. Hodnota P(t) pravdepodobnosti bezporuchovej prevádzky (vypočítaná hodnota P(t) by nemala byť menšia ako 0,85) je určená výrazom
kde t je prevádzkový čas systému, hodiny (t je vybraný z rozsahu: 1000, 2000, 4000, 8000, 10000 hodín);
λ – poruchovosť zariadenia, 1/h;
T 0 – čas medzi poruchami, hodiny.
Výpočet spoľahlivosti pozostáva zo zistenia celkovej poruchovosti λ zariadenia a času medzi poruchami:
Čas obnovy poruchy zariadenia zahŕňa čas na vyhľadanie chybného prvku, čas na jeho výmenu alebo opravu a čas na kontrolu funkčnosti zariadenia.
Priemerný čas zotavenia T v elektrických zariadeniach je možné zvoliť z rozsahu 1, 2, 4, 6, 8, 10, 12, 18, 24, 36, 48 hodín. Menšie hodnoty zodpovedajú zariadeniam s vysokou udržiavateľnosťou. Priemerný čas obnovy Tin je možné skrátiť pomocou zabudovaného riadenia alebo autodiagnostiky, modulárneho dizajnu komponentov, prístupnej inštalácie.
Hodnota faktora dostupnosti je určená vzorcom
kde T 0 – čas medzi poruchami, hodiny.
T in – priemerný čas zotavenia, hodiny.
Spoľahlivosť prvkov do značnej miery závisí od ich elektrických a teplotných prevádzkových podmienok. Na zvýšenie spoľahlivosti sa prvky musia používať v režimoch nízkej záťaže, ktoré sú určené faktormi zaťaženia.
Vyťaženosť - je to pomer vypočítaného parametra prvku v prevádzkovom režime k jeho maximálnej prípustnej hodnote. Faktory zaťaženia rôznych prvkov sa môžu značne líšiť.
Pri výpočte spoľahlivosti zariadenia sú všetky prvky systému rozdelené do skupín prvkov rovnakého typu a rovnakých faktorov zaťaženia Kn.
Miera zlyhania i-tého prvku je určená vzorcom
(10.3)
kde Kn i je koeficient zaťaženia vypočítaný v mapách prevádzkových režimov alebo nastavený za predpokladu, že prvok pracuje v normálnych režimoch, v prílohe D sú uvedené hodnoty koeficientov zaťaženia prvkov;
λ 0і – základná poruchovosť i -tého prvku je uvedená v prílohe D.
Na výpočet spoľahlivosti sa často používajú údaje o poruchovosti λ 0і analógových prvkov.
Príklad výpočtu spoľahlivosti zariadenia pozostávajúci zo zakúpeného importovaného komplexu BT-85W a zdroja energie vyvinutého na elementárnej báze pre sériovú výrobu.
Poruchovosť dovážaných výrobkov sa určuje ako prevrátená doba prevádzky (niekedy sa berie záručná doba na servis výrobku) na základe prevádzky určitého počtu hodín denne.
Garantovaná životnosť zakúpeného dovážaného produktu je 5 rokov, produkt bude fungovať 14,24 hodín denne:
T = 14,24 hodín x 365 dní x 5 rokov = 25981 hodín – čas medzi poruchami.
10 -6 1/hod - poruchovosť.
Výpočty a počiatočné údaje sa vykonávajú na počítači pomocou programov Excel a sú uvedené v tabuľkách 10.1 a 10.2. Príklad výpočtu je uvedený v tabuľke 10.1.
Tabuľka 10.1 – Výpočet spoľahlivosti systému
Názov a typ prvku alebo analógu | Koeficient, zaťaženie, K n i | ||||
λi*10-6,1/h | λ i * K n i * 10-6 1 / h | množstvo n i, | n i *λ i *10-6,1/h | ||
Komplexný BT-85W | 1,00 | 38,4897 | 38,4897 | 38,4897 | |
Kondenzátor K53 | 0,60 | 0,0200 | 0,0120 | 0,0960 | |
Zásuvka (zástrčka) SNP268 | 0,60 | 0,0500 | 0,0300 | 0,0900 | |
TRS čip | 0,50 | 0,0460 | 0,0230 | 0,0230 | |
OMLT odpor | 0,60 | 0,0200 | 0,0120 | 0,0120 | |
Poistková vložka VP1-1 | 0,30 | 0,1040 | 0,0312 | 0,0312 | |
Zenerova dióda 12V | 0,50 | 0,4050 | 0,2500 | 0,4050 | |
Indikátor 3L341G | 0,20 | 0,3375 | 0,0675 | 0,0675 | |
Tlačidlový spínač | 0,30 | 0,0100 | 0, 0030 | 0,0030 | |
Fotodióda | 0,50 | 0,0172 | 0,0086 | 0,0086 | |
Zváracie spojenie | 0,40 | 0,0001 | 0,0004 | 0,0004 | |
Drôt, m | 0,20 | 0,0100 | 0,0020 | 0,2 | 0,0004 |
Spájkované spojenie | 0,50 | 0,0030 | 0,0015 | 0,0045 | |
l celé zariadenie | å=39,2313 |
Určite celkovú poruchovosť zariadenia
Potom sa stredný čas medzi poruchami podľa výrazu (10.2) rovná
Na určenie pravdepodobnosti bezporuchovej prevádzky v určitom časovom období zostrojíme graf závislosti:
Tabuľka 10.2 - Výpočet pravdepodobnosti bezporuchovej prevádzky
t (hodina) | |||||||||
P(t) | 0,97 | 0,9 | 0,8 | 0,55 | 0,74 | 0,65 | 0,52 | 0,4 | 0,34 |
Graf pravdepodobnosti bezporuchovej prevádzky oproti prevádzkovému času je znázornený na obrázku 10.1.
Obrázok 10.1 – Pravdepodobnosť bezporuchovej prevádzky verzus prevádzkový čas
Pravdepodobnosť bezporuchovej prevádzky zariadenia sa zvyčajne nastavuje od 0,82 do 0,95. Podľa grafu na obrázku 10.1 môžeme pre vyvíjané zariadenie určiť pri danej pravdepodobnosti bezporuchovej prevádzky P(t) = 0,82 čas medzi poruchami T o = 5000 hodín.
Výpočet bol urobený pre prípad, keď porucha niektorého prvku vedie k poruche celého systému ako celku, takéto spojenie prvkov sa nazýva logicky sekvenčné alebo základné. Spoľahlivosť možno zvýšiť redundanciou.
Napríklad. Technológia prvkov zabezpečuje priemernú poruchovosť elementárnych častí l i = 1 x 10-5 1/h . Pri použití v zariadení N = 1 x 10 4 elementárne časti celková poruchovosť l o = N*li = 10-1 1/h . Potom priemerná doba prevádzky zariadenia To = 1 / menej = 10 h) Ak vytvoríte zariadenie založené na 4 identických zariadeniach zapojených paralelne, potom sa priemerný čas bez poruchy zvýši N/4=2500-krát a bude 25 000 hodín alebo 34 mesiacov alebo približne 3 roky.
Vzorce umožňujú vypočítať spoľahlivosť zariadenia, ak sú známe počiatočné údaje - zloženie zariadenia, režim a podmienky jeho prevádzky a poruchovosť jeho prvkov.
“Zabezpečenie vysokej dostupnosti”
Cieľ práce:
Preštudujte si dva typy prostriedkov na udržanie vysokej dostupnosti: zabezpečenie odolnosti voči poruchám (neutralizácia porúch, schopnosť prežitia) a zabezpečenie bezpečnej a rýchlej obnovy po poruchách (údržba). Získajte zručnosti v práci na zabezpečenie vysokej dostupnosti.
1. Teoretický úvod
1.1. Dostupnosť
1.11. Základné pojmy
Informačný systém poskytuje svojim používateľom určitý súbor služieb. Hovorí sa, že požadovaná úroveň dostupnosti týchto služieb je zabezpečená, ak sú tieto ukazovatele v rámci stanovených limitov:
Efektívnosť služby. Efektívnosť služby sa určuje z hľadiska maximálneho času na obsluhu požiadavky, počtu podporovaných používateľov atď. Vyžaduje sa, aby účinnosť neklesla pod vopred stanovený prah.
Doba nedostupnosti. Ak účinnosť informačnej služby nevyhovuje uloženým obmedzeniam, služba sa považuje za nedostupnú. Vyžaduje sa, aby maximálna dĺžka doby nedostupnosti a celková doba nedostupnosti za určité obdobie (mesiac, rok) neprekročili vopred stanovené limity.
V podstate sa vyžaduje, aby informačný systém fungoval s požadovanou efektivitou takmer vždy. Pre niektoré kritické systémy (napríklad riadiace systémy) by mala byť doba nedostupnosti nulová, bez akéhokoľvek „takmer“. V tomto prípade hovoria o pravdepodobnosti výskytu situácie nedostupnosti a vyžadujú, aby táto pravdepodobnosť neprekročila danú hodnotu. Na vyriešenie tohto problému boli vytvorené a vznikajú špeciálne systémy odolné voči poruchám, ktorých náklady sú spravidla veľmi vysoké.
Prevažná väčšina komerčných systémov podlieha menej prísnym požiadavkám, no moderný obchodný život kladie aj tu dosť prísne obmedzenia, keď počet obsluhovaných používateľov možno merať v tisíckach, doba odozvy by nemala presiahnuť niekoľko sekúnd a doba nedostupnosti by mala byť nepresiahne niekoľko hodín ročne.
Problém zabezpečenia vysokej dostupnosti musí byť vyriešený pre moderné konfigurácie zabudované v technológii klient/server. To znamená, že celý reťazec potrebuje ochranu – od používateľov (prípadne vzdialených) až po kritické servery (vrátane bezpečnostných serverov).
O hlavných hrozbách pre prístupnosť sa hovorilo už skôr.
V súlade s GOST 27.002 sa poruchou rozumie udalosť, ktorá zahŕňa poruchu výrobku. Produktom je v kontexte tejto práce informačný systém alebo jeho komponent.
V najjednoduchšom prípade môžeme predpokladať, že poruchy ktoréhokoľvek komponentu zloženého produktu vedú k celkovému zlyhaniu a rozloženie porúch v čase je jednoduchý Poissonov tok udalostí. V tomto prípade sa zavádza pojem poruchovosť A stredný čas medzi poruchami, ktoré sú vzájomne prepojené vzťahom
i - číslo komponentu,
Poruchovosť
Priemerný čas medzi poruchami.
Miera zlyhania nezávislých komponentov sa sčítava:
a stredný čas medzi poruchami pre kompozitný výrobok je daný vzťahom
Už tieto jednoduché výpočty ukazujú, že ak existuje komponent, ktorého poruchovosť je oveľa väčšia ako u ostatných, tak je to práve tento komponent, ktorý určuje strednú dobu medzi poruchami celého informačného systému. Toto je teoretické zdôvodnenie princípu posilňovania najslabšieho článku ako prvého.
Poissonov model nám umožňuje zdôvodniť ďalší veľmi dôležitý bod, a to, že empirický prístup k budovaniu systémov vysokej dostupnosti nemožno implementovať v prijateľnom čase. V tradičnom cykle testovania/ladenia softvérového systému, optimisticky, každá oprava chyby vedie k exponenciálnemu zníženiu (asi o polovicu desatinného rádu) miery zlyhania. Z toho vyplýva, že na to, aby ste si experimentálne overili, či bola dosiahnutá požadovaná úroveň dostupnosti, bez ohľadu na použitú technológiu testovania a ladenia, budete musieť stráviť čas takmer rovnaký ako priemerný čas medzi zlyhaniami. Napríklad na dosiahnutie stredného času medzi poruchami 105 hodín by to trvalo viac ako 104,5 hodiny, čo je viac ako tri roky. To znamená, že na budovanie systémov vysokej dostupnosti potrebujeme iné metódy, metódy, ktorých účinnosť bola analyticky alebo prakticky overená viac ako päťdesiatimi rokmi vývoja výpočtovej techniky a programovania.
Poissonov model je použiteľný v prípadoch, keď informačný systém obsahuje jednotlivé body zlyhania, teda komponenty, ktorých porucha vedie k zlyhaniu celého systému. Na štúdium redundantných systémov sa používa iný formalizmus.
V súlade s vyjadrením problému budeme predpokladať, že existuje kvantitatívna miera účinnosti informačných služieb poskytovaných produktom. V tomto prípade sa zavádzajú pojmy ukazovateľov efektívnosti jednotlivých prvkov a efektívnosti fungovania celého komplexného systému.
Ako meradlo dostupnosti môžeme brať pravdepodobnosť prijateľnosti efektívnosti služieb poskytovaných informačným systémom počas celého posudzovaného obdobia. Čím väčšia je dostupná hranica účinnosti nadbytok v konfigurácii systému platí, že pravdepodobnosť, že systém je prítomný, tým vyššia je jeho dostupnosť.
Efektívnosť informačných služieb počas posudzovaného obdobia neklesne pod povolenú hranicu, závisí nielen od pravdepodobnosti zlyhania komponentov, ale aj od času, počas ktorého zostanú nefunkčné, keďže v tomto prípade celková účinnosť klesá, a každé ďalšie zlyhanie sa môže stať osudným. Pre maximalizáciu dostupnosti systému je potrebné minimalizovať prestoje jednotlivých komponentov. Okrem toho je potrebné vziať do úvahy, že vo všeobecnosti môžu opravy vyžadovať zníženie účinnosti alebo dokonca dočasné odstavenie funkčných komponentov; tento druh vplyvu je tiež potrebné minimalizovať.
Niekoľko terminologických poznámok. Zvyčajne sa v literatúre o teórii spoľahlivosti namiesto dostupnosti hovorí o dostupnosti (vrátane vysokej dostupnosti). Pojem „dostupnosť“ sme uprednostnili, aby sme zdôraznili, že informačná služba by nemala byť len „pripravená“ sama o sebe, ale mala by byť prístupná pre svojich používateľov v podmienkach, keď situácie nedostupnosti môžu byť spôsobené dôvodmi, ktoré na prvý pohľad nemajú priamy vzťah k služby (príklad - nedostatok poradenských služieb).
Ďalej, namiesto času nedostupnosti, zvyčajne hovoria o faktor dostupnosti. Chceli sme venovať pozornosť dvom ukazovateľom – trvanie jedného výpadku a celkové trvanie výpadku, preto sme uprednostnili termín „doba nedostupnosti“, keďže je priestrannejší.
Typická závislosť poruchovosti od času: I - doba zábehu a poruchy nekvalitných výrobkov; II - obdobie bežnej prevádzky; III - obdobie starnutia (poruchy sú spôsobené opotrebovaním dielov alebo starnutím materiálov). Poruchovosť niektorých výrobkov (napríklad polovodičových zariadení) sa počas celej doby prevádzky nezvyšuje, to znamená, že nemajú obdobie starnutia, preto sa niekedy hovorí, že ich životnosť je večná.
Poruchovosť- pomer počtu zlyhaných objektov (vzorky zariadení, výrobkov, častí, mechanizmov, zariadení, zostáv atď.) za jednotku času k priemernému počtu objektov, ktoré správne fungujú v danom časovom období, za predpokladu, že zlyhané objekty nie sú obnovené alebo vymenené za prevádzkyschopné. Inými slovami, miera zlyhania sa číselne rovná počtu porúch za jednotku času vydelenému počtom uzlov, ktoré do tohto času fungovali bez zlyhania. Nasledujúce definície poruchovosti sú ekvivalentné:
λ (t) = n (t) N c p Δ t = n (t) [ N − n (t) ] Δ t = f (t) P (t) (\displaystyle \lambda (t)=(\frac ( n(t))(N_(cp)\Delta t))=(\frac (n(t))(\vľavo\Delta t))=(\frac (f(t))(P(t))) )
Kde N (\displaystyle N)- celkový počet posudzovaných produktov;
f (t) (\displaystyle f(t))- poruchovosť - počet produktov, ktoré v danom čase zlyhali t (\displaystyle t) za jednotku času;
P (t) (\displaystyle P(t))- počet produktov, niečasom zlyhal t (\displaystyle t);
n (t) (\displaystyle n(t))- počet neúspešných vzoriek v časovom intervale od t − (Δ t / 2) (\displaystyle t-(\Delta t/2)) predtým t + (Δ t / 2) (\displaystyle t+(\Delta t/2));
- časový interval;
N c p (\displaystyle (N_(cp)))- priemerný počet správne pracujúcich vzoriek v intervale Δ t (\displaystyle \Delta t):
N c p = NI + NI + 1 2 (\displaystyle (N_(cp))=(\frac (N_(i)+N_(i+1))(2)))
Kde N i (\displaystyle N_(i))- počet správne fungujúcich vzoriek na začiatku intervalu Δ t (\displaystyle \Delta t);
N i + 1 (\displaystyle N_(i+1))- počet správne fungujúcich vzoriek na konci intervalu Δ t (\displaystyle \Delta t).
Dimenzia poruchovosti je prevrátená k času, zvyčajne sa meria v 1/hod.
Príklady
Počas testu trvajúceho 3 000 hodín z 1 000 produktov zlyhalo 150. Potom miera zlyhania týchto produktov:
λ (3 000) = 150 (1 000 − 150) ⋅ (3 000 − 0) ≈ 5, 8824 ⋅ 10 − 5 (\displaystyle \lambda (3000)=(\frac (150)((1000-1000-15) -0)))\približne 5,8824\cdot 10^(-5)) 1 hodina.
Napríklad priemerné hodnoty poruchovosti za dané obdobie bežné používanie sú:
Pre elektronické komponenty sa zhromažďujú štatisticky najspoľahlivejšie údaje o poruchovosti.
- Diskrétne odpory: od 1 ⋅ 10 − 9 (\displaystyle 1\cdot 10^(-9)) až 1/hod.
- Diskrétne neelektrolytické kondenzátory: od do 1 ⋅ 10 − 8 (\displaystyle 1\cdot 10^(-8)) 1 hodina.
- Elektrolytické kondenzátory: od 1 ⋅ 10 − 3 (\displaystyle 1\cdot 10^(-3)) až 1/hod.
- Polovodičové súčiastky s nízkym výkonom (diódy, tranzistory) po zábehu: od 1 ⋅ 10 − 6 (\displaystyle 1\cdot 10^(-6)) až 1/hod.
- Integrované obvody pri bežnej prevádzke: od 1 ⋅ 10 − 5 (\displaystyle 1\cdot 10^(-5)) predtým 1 ⋅ 10 − 7 (\displaystyle 1\cdot 10^(-7)) 1 hodina.
Anotácia: Zvažujú sa dva typy prostriedkov na udržanie vysokej dostupnosti: zabezpečenie odolnosti voči poruchám (neutralizácia porúch, schopnosť prežitia) a zabezpečenie bezpečnej a rýchlej obnovy po poruchách (obslužnosť).
Dostupnosť
Základné pojmy
Informačný systém poskytuje svojim používateľom určitý súbor služieb. Hovorí sa, že požadovaná úroveň dostupnosti týchto služieb je zabezpečená, ak sú tieto ukazovatele v rámci stanovených limitov:
- Efektívnosť služby. Efektívnosť služby sa určuje z hľadiska maximálneho času na obsluhu požiadavky, počtu podporovaných používateľov atď. Vyžaduje sa, aby účinnosť neklesla pod vopred stanovený prah.
- Doba nedostupnosti. Ak účinnosť informačnej služby nevyhovuje uloženým obmedzeniam, služba sa považuje za nedostupnú. Vyžaduje sa, aby maximálna dĺžka doby nedostupnosti a celková doba nedostupnosti za určité obdobie (mesiac, rok) neprekročil vopred stanovené limity.
V podstate sa vyžaduje, aby informačný systém fungoval s požadovanou efektivitou takmer vždy. Pre niektoré kritické systémy (ako sú riadiace systémy) doba nedostupnosti by mala byť nulová, bez akéhokoľvek „takmer“. V tomto prípade hovoria o pravdepodobnosti výskytu situácie nedostupnosti a vyžadujú, aby táto pravdepodobnosť neprekročila danú hodnotu. Na vyriešenie tohto problému, špeciálne systémy odolné voči poruchám, ktorých náklady sú zvyčajne veľmi vysoké.
Prevažná väčšina komerčných systémov podlieha menej prísnym požiadavkám, ale moderný obchodný život tu kladie dosť prísne obmedzenia, keď počet obsluhovaných používateľov možno merať v tisíckach, doba odozvy by nemala presiahnuť niekoľko sekúnd a doba nedostupnosti– niekoľko hodín ročne.
Úlohou zabezpečiť vysoká dostupnosť musia byť riešené pre moderné konfigurácie zabudované v technológii klient/server. To znamená, že celý reťazec potrebuje ochranu – od používateľov (prípadne vzdialených) až po kritické servery (vrátane bezpečnostných serverov).
O hlavných hrozbách pre prístupnosť sa hovorilo už skôr.
V súlade s GOST 27.002, pod odmietnutie sa vzťahuje na udalosť, ktorá zahŕňa poruchu produktu. Produktom je v kontexte tejto práce informačný systém alebo jeho komponent.
V najjednoduchšom prípade môžeme predpokladať, že poruchy ktoréhokoľvek komponentu zloženého produktu vedú k celkovému zlyhaniu a rozloženie porúch v čase je jednoduchý Poissonov tok udalostí. V tomto prípade predstavte koncept poruchovosť a , ktoré spolu súvisia vzťahom
kde je číslo komponentu,
– poruchovosť,
– .
Miera zlyhania nezávislé komponenty sa sčítajú:
A stredný čas medzi poruchami pre zložený výrobok je daný vzťahom
Už tieto jednoduché výpočty ukazujú, že ak komponent existuje, poruchovosť ktorý je oveľa väčší ako ostatné, potom je to on, kto určuje stredný čas medzi poruchami celý informačný systém. Toto je teoretické zdôvodnenie princípu posilňovania najslabšieho článku ako prvého.
Poissonov model nám umožňuje podložiť ďalší veľmi dôležitý bod, a to empirický prístup k budovaniu systémov vysoká dostupnosť nie je možné realizovať v prijateľnom čase. V tradičnom cykle testovania/ladenia softvérového systému optimisticky každá oprava chyby vedie k exponenciálnemu poklesu (približne o polovicu desatinného rádu) poruchovosť. Z toho vyplýva, že na experimentálne overenie dosiahnutia požadovanej úrovne dostupnosti, bez ohľadu na použitú technológiu testovania a ladenia, budete musieť stráviť čas takmer rovný stredný čas medzi poruchami. Napríklad dosiahnuť stredný čas medzi poruchami 10 5 hodín si vyžiada viac ako 10 4,5 hodiny, čo je viac ako tri roky. To znamená, že sú potrebné iné metódy budovania systémov. vysoká dostupnosť, metódy, ktorých účinnosť bola analyticky alebo prakticky overená počas viac ako päťdesiatich rokov vývoja výpočtovej techniky a programovania.
Poissonov model je použiteľný v prípadoch, keď informačný systém obsahuje jednotlivé body zlyhania, teda komponenty, ktorých porucha vedie k zlyhaniu celého systému. Na štúdium redundantných systémov sa používa iný formalizmus.
V súlade s vyjadrením problému budeme predpokladať, že existuje kvantitatívna miera účinnosti informačných služieb poskytovaných produktom. V tomto prípade sú zavedené pojmy ukazovatele výkonnosti jednotlivých prvkov a efektívnosti fungovania celého komplexného systému.
Ako meradlo dostupnosti môžeme brať pravdepodobnosť prijateľnosti efektívnosti služieb poskytovaných informačným systémom počas celého posudzovaného obdobia. Čím väčšia je marža efektívnosti systému, tým vyššia je jeho dostupnosť.
Ak je v konfigurácii systému redundancia, pravdepodobnosť, že počas uvažovaného časového obdobia efektívnosť informačných služieb neklesnú pod prípustnú hranicu, závisí nielen od pravdepodobnosti zlyhania komponentov, ale aj od času, počas ktorého zostanú nefunkčné, pretože v tomto prípade klesá celková účinnosť a každá následná porucha sa môže stať osudnou. Pre maximalizáciu dostupnosti systému je potrebné minimalizovať prestoje jednotlivých komponentov. Okrem toho je potrebné vziať do úvahy, že vo všeobecnosti môžu opravy vyžadovať zníženie účinnosti alebo dokonca dočasné odstavenie funkčných komponentov; tento druh vplyvu je tiež potrebné minimalizovať.
Niekoľko terminologických poznámok. Zvyčajne sa v literatúre o teórii spoľahlivosti hovorí namiesto dostupnosti pripravenosť(vrátane vysokej dostupnosti). Aby sme to zdôraznili, uprednostnili sme termín „dostupnosť“. informačná služba by mala byť nielen „pripravená“ sama osebe, ale mala by byť prístupná svojim používateľom v podmienkach, keď situácie nedostupnosti môžu byť spôsobené dôvodmi, ktoré na prvý pohľad priamo nesúvisia so službou (napríklad nedostatok poradenských služieb).
Ďalej namiesto toho doba nedostupnosti zvyčajne hovoriť o faktor dostupnosti. Chceli sme venovať pozornosť dvom ukazovateľom – trvanie jedného prestoja a celkové trvanie prestoja, preto sme uprednostnili výraz „ doba nedostupnosti„ako priestrannejšie.
Základy vysokej dostupnosti
Základom opatrení na zlepšenie dostupnosti je použitie štruktúrovaného prístupu, ktorý je obsiahnutý v objektovo orientovanej metodológii. Štruktúrovanie je nevyhnutné vo vzťahu ku všetkým aspektom a komponentom informačného systému – od architektúry po administratívne databázy, vo všetkých fázach jeho životného cyklu – od spustenia až po vyradenie z prevádzky. Štruktúrovanie, hoci je samo osebe dôležité, je tiež nevyhnutnou podmienkou pre praktickú realizovateľnosť iných opatrení na zlepšenie dostupnosti. Iba malé systémy môžu byť postavené a prevádzkované podľa želania. Veľké systémy majú svoje zákonitosti, ktoré, ako sme už uviedli, si programátori prvýkrát uvedomili pred viac ako 30 rokmi.
Pri vývoji bezpečnostných opatrení vysoká dostupnosť