Rendelkezésre állás

Egy fogalom, amelyet gyakran összetévesztenek a biztonsági mentés fogalmával: a rendelkezésre állás.

Míg a biztonsági mentés azt jelenti, hogy ha adataink az elsődleges tárolási helyükön váratlan hiba vagy szándékos támadás miatt elvesznek, azokat egy biztonságosan tárolt másolattal helyettesíteni tudjuk.

Ezzel szemben a rendelkezésre állás azt jelenti, hogy adatainkhoz hozzáférhetünk, amikor szükségünk van rájuk, azok elérését – rendelkezésre állását – semmi nem akadályozza. Például szervereinket redundáns tápegységekkel láthatjuk el, hogy ha az egyik táp meghibásodik, a szerver még ugyanúgy munkába álljon és adatainkat elérjük addig is, amíg a hibás alkatrészt pótoljuk.

Fontos észben tartani, hogy a magas rendelkezésre állás biztosítása nem helyettesíti a biztonsági mentések készítésének feladatát! A rendelkezésre állás növelése az adatokhoz való hozzáférés átmeneti kieséseinek számát és idejét csökkenti, míg a biztonsági mentés a végleges adatvesztés esetére ad mentőhálót.

Milyen rendelkezésre állás az ideális? – Nos, az ösztöneink azt súgják: a 100%-os rendelkezésre állás – teljesen biztosak akarunk lenni benne, hogy adatainkhoz mindig, bármely pillanatban hozzáférünk, és ezt semmilyen technikai probléma nem akadályozza. A kérdés azonban nem ilyen egyszerű: egy magas rendelkezésre állású rendszer kiépítése mindig drágább.

Mit jelentenek a rendelkezésre állás százalékos értékei?

Az alábbi táblázat tájékoztatást ad, hogy adott rendelkezésre állás esetén mekkora kiesést kell tolerálnunk évente.

Rendelkezésre állás szintje Kiesés mértéke
90% 36,5 nap
95% 18,25 nap
99% 3,65 nap
99,9% 8,76 óra
99,99% 50 perc
99,999% 5 perc
(Forrás: ibm.com)

Ahogy a biztonsági mentések esetén is, egy vállalkozásnak meg kell hoznia a döntést, hogy saját infrastruktúrát épít-e ki a rendelkezésre állás növelésére, vagy egy szolgáltatót bíz meg adatai kezelésével. Nagy rendelkezésre állás eléréséhez jó megoldás lehet egy felhő alapú szolgáltatás igénybevétele, hiszen az adatok tárolására specializálódott cégek gazdaságosabban tudnak kiépíteni és rendelkezésünkre bocsátani egy stabil infrastruktúrát.

Egy ilyen szolgáltatás például a Microsoft által forgalmazott Office 365 (az ismerős Office csomag felhő alapú szolgáltatással támogatott változata), amely céges előfizetés esetén 99,9%-os rendelkezésre állást vállal, évente legfeljebb 8 óra nem tervezett leállással. Amennyiben a vállalt rendelkezésre állás egy hónapban nem teljesül, a következő havi havidíjból jóváírással kompenzálják a kiesést.

Néhány, a rendelkezésre állással kapcsolatos fontos kifejezés:

SPOF: Egyetlen meghibásodási pont: A rendszer egy olyan összetevője, amelynek meghibásodása a teljes rendszer működésére kihatással van.

Átterhelés: Egy hasonló rendszerkomponens automatikusan átveszi a meghibásodott összetevő funkcióját.

Hideg készenlét: A készenléti hardver nincs bekapcsolva. Az átállást kézzel kell elvégezni, a meghibásodás ténye világosan látható lesz.

Meleg készenlét: A tartalékrendszer a háttérben fut, így az átállás automatikus lehet. A két rendszeren az adatok automatikusan szinkronizálásra kerülnek. A felhasználó számára az átterhelés a szolgáltatás nagyon gyors újraindításának látszik. Az aktuális tranzakció azonban megszakadhat, mert nem biztos, hogy sikerül szinkronizálni az adatokat a meghibásodás előtti állapottal.

Forró készenlét: Mindkét rendszer folyamatosan, párhuzamosan fut – az adatok mindkét rendszeren száz százalékban szinkronban vannak. A felhasználók semmilyen hibát nem vesznek észre. Ez a szint általában nem érhető el a kliens megfelelő módosítása nélkül. Ahhoz, hogy mindkét rendszer tökéletesen szinkronban működjön, a klienskapcsolatokat is száz százalékban tükrözni kell. Ez általában azt igényli, hogy a kliensek egyidejűleg két vagy több kiszolgálóval tartsanak fent kapcsolatot és az összessel egyidejűleg kommunikáljanak. Egy szokásos webböngésző például erre képtelen.

Terheléselosztás: A terhelés elosztása több számítógép között. Terheléselosztást például in LVS környezetben alkalmaznak (virtuális Linux-kiszolgáló).

STONITH: Az angol „Shot the other node in the head” (a másik csomópont agyonlövése) rövidítése: Speciális hardver és szoftver együttese, amelyik biztosítja, hogy egy meghibásodott csomópont ne férjen hozzá írásra egy cluster megosztott adathordozójához, amivel a teljes cluster adatainak a konzisztenciáját veszélyeztetné. Ez általában a rendszer áramellátásának szabályozását (lekapcsolását) jelenti.

Egy magas rendelkezésre állású megoldás összetevői

Általános infrastruktúra
Egy magas rendelkezésre állású megoldás tervezésekor általában célszerű ügyelni arra, hogy pusztán az a tény, hogy az összes fontos kiszolgáló egy helyen működik, szintén jelenthet egyetlen meghibásodási pontot, ha valamilyen katasztrófa (vagy nagyon komoly áramkimaradás) sújtja a telephelyet. Szintén érdemes figyelembe venni a kiszolgálók környezeti feltételeit is – a (redundáns) légkondicionálás elengedhetetlen.

Hardver
A legkifinomultabb szoftverrel sem lehet magas rendelkezésre állású rendszert építeni, ha a hardver nem garantálja a lehető legnagyobb biztonságot. A legfontosabb hardverelemek, amelyeket a maximális lehetséges redundancia érdekében figyelembe kell venni:

Tápegység
Ha lehetséges, védje a kiszolgálókat egy szünetmentes tápegységgel (UPS-sel) a rövid áramkimaradások elleni védelem érdekében, illetve hogy hosszabb áramkimaradás esetén a rendszert szabályosan lehessen leállítani. A tápegységet is célszerű redundáns működésre beállítani.
Hálózati csatolók
Gondoskodjon róla, hogy a rendszerek mindegyike több hálózati csatolóval rendelkezzen. Ha az egyik csatoló meghibásodik, egy másiknak automatikusan át kell vennie a meghibásodott komponens címét és feladatát. A redundancia kifejezetten érvényes a csatoló mindkét irányára. Nem lehet baj abból, ha külön aktív és tartalék csatolókat tervez mind a belső, mind a külső csatolókhoz.
Merevlemezek, háttértárak
Építsen több merevlemezt/ssd-t a rendszerbe és alakítsa ki az adatok tartalékolását úgy (például RAID vagy drbd használatával), hogy ha a lemezek valamelyike meg is hibásodik, a többi lemez tartalmazza az érintetlen adatrekordot. Ebben az esetben kicserélhető a lemez egy újra anélkül, hogy le kellene állítani a rendszert.
Alkalmazások
A rendszer külső megjelenését alkotó minden fontos adatot és alkalmazást úgy kell kialakítani, hogy ne akadályozzák az újraindulást. Ha egy alkalmazás nem engedi el a zárolási fájljait egy összeomlás után, ez megakadályozhatja a megfelelő folyamat újraindulását. Ez azt jelenti, hogy az ilyen alkalmazások nem alkalmasak magas rendelkezésre állású környezetben működésre. Ideális esetben az egyes alkalmazások, operációsrendszer-folyamatok és hálózati kapcsolatok »egészségi állapotát« egységesen lehet felügyelni egy megfelelő figyelőeszközzel.
Adatok
Miután a rendszer leállt, az összes fontos adatot az átvevő rendszer számára biztosítani kell, sértetlenül. Az ilyen jellegű magas rendelkezésre állást úgy lehet elérni, ha a tárolt adatokat több rendszeren vagy merevlemezen elosztjuk. Így például egy lemez tartalmát rendszeresen tükrözzük egy (vagy több) másik lemezre, amely(ek) átveheti(k) a feladatokat meghibásodás esetén. Egy naplózó fájlrendszerrel pedig biztosítható, hogy a fájlrendszer konzisztens állapotban legyen egy rendszerösszeomlás után is.
Hálózat
A teljes hálózati infrastruktúrát redundáns módon kell kialakítani, az útválasztótól és a kapcsolóktól kezdve egészen a hálózati kábelekig.

Forrás: microsoft.com, opensuse.org

Kategóriák

Friss bejegyzések

WS2022 – WDS

Playwright teszt