5 Opozorilni znaki kritične napake opreme

Avtor: Judy Howell
Datum Ustvarjanja: 25 Julij. 2021
Datum Posodobitve: 21 Junij 2024
Anonim
5 Opozorilni znaki kritične napake opreme - Tehnologija
5 Opozorilni znaki kritične napake opreme - Tehnologija

Vsebina


Odvzem:

Zmanjšanje izpadov s natančnim vnaprejšnjim načrtovanjem lahko pomeni razliko med rastjo in padcem podjetja. To je čas, ko pride srednji čas med neuspehom.

Ne podcenjujte, koliko se današnje korporacije vsak dan zanašajo na kritične sisteme. Zato je edino zdravo pamet, da lahko podjetje presodi tveganje odpovedi opreme. Brez zagotovil o tem, kdaj lahko kakšen del opreme odpove, mora obstajati vsaj natančna ocena o tem, kdaj se ne more več šteti za zanesljiv.

V nasprotnem primeru se neviden kos opreme morda ne zdi ključen za posel, a ko en ventilator hlajenja odpove, povzroči, da se generator prepusti duhu in povzroči več deset ali celo sto tisoč uporabnikom drage težave v daljšem obdobju, lahko glejte, da je mogoče oceniti, kateri sestavni deli vaše infrastrukture - in kdaj - bodo izrednega pomena. Tam nastopi srednji čas med odpovedmi (MTBF), metoda, na katero se IT strokovnjaki zanašajo, da bodo natančni ocene o tem, kdaj bo kritična oprema odpovedala. Tu si oglejmo, kaj končno ubija nekatere običajne vrste kritične opreme in kako lahko MTBF pomaga rešiti dan.


Kaj je MTBF?

Vsakemu proizvedenemu kosu opreme je dodeljena edinstvena številka modela. Tisti, ki igrajo pomembno vlogo v kritični infrastrukturi, so kupcem na voljo z oceno MTBF. Kompleksni izračuni za izdelavo MTBF-a za kos opreme potekajo v dolgi fazi testiranja v okviru raziskav in razvoja izdelkov in so razmeroma specifični za določen model.

Če želite najti MTBF za določen kos opreme, ga boste našli v podrobni specifikaciji, ki jo je predložil proizvajalec. Lahko se obrnete tudi neposredno na proizvajalca.

Usmerjanje

Usmerjevalnik za podjetja vključuje številne dele, nekatere premikajoče in druge statične. Obe napajalni enoti (PSU) in ventilatorji za hlajenje imajo gibljive dele in njene elemente, ki so ponavadi odpovedani, še posebej, če je enota nameščena v razmeroma brez prahu podatkovnega centra. Na srečo bo večina usmerjevalnikov z nekaterimi vnosi skrbnika poročala SysLog objekt, tako da se lahko označijo vse okvarjene komponente.


Stikala

V podobnem smislu je naslednja stopnja znotraj podjetniške mreže preklopna strojna oprema. Čeprav se stikala podjetniške stopnje ponavadi zanašajo na ventilatorje, jih je običajno manj kot tistih, ki jih najdemo v šasiji usmerjevalnika. Če so mehanizmi vrtinčenja ventilatorjev nepoškodovani, se napačno stikalo ponavadi slabo ponaša na programski ravni, bodisi tako, da nepričakovano onemogoči stikalo ali, pogosteje, izkaže nenavadno vedenje, kot je spuščanje paketov, povzroča različne stopnje motenj v prometu ali nepravilno spreminjanje uporabniško določene nastavitve, ne da bi to zahtevali.

Cisco mrežni behemoth oglašuje enega od svojih usmerjevalnikov, da ima MTBF 188.574 ur za model Cisco Catalyst 3750G-24TS. Če to razdelimo na 8.765.81277 (število ur v enem letu), potem vidimo, da ima ta model ocena MTBF približno 21,5 let. Ta številka je nekaj prepričljivega, če menite, da mora ta oprema delovati brezhibno 24/7, čeprav v resnici to preprosto kaže na njeno zanesljivost. Kljub temu daje uporabnikom izobraženo ugibanje o tem, kako dolgo lahko pričakujemo, da bo ta del opreme zdržal.

Prožna moč

Neprekinjeni napajalniki (UPS), priključeni na veliko število baterij, lahko v kratkem črkovanju zagotovijo rezervno napajanje v podjetju, preden se generatorji izklopijo med izpadom električne energije. Nekatere posebne napake v programski opremi se lahko pojavijo znotraj UPS-a, kot pri katerem koli kosu opreme, na splošno pa ponavadi največ skrbi povzročajo baterije, iz katerih črpajo moč. Če se baterija UPS pogosto izklopi in napolni, se njena zmogljivost hitreje zmanjša, čas delovanja pa se drastično skrajša. Presenetljivo je, da lahko tudi UPS baterije popolnoma izpadejo. UPS lahko poroča preko modemov in omrežij, ko se pojavijo napake, vendar pogosteje kot starejši UPS sprožijo zvočne alarme, ko se pojavi težava.

Brez napak, brez stresa - vaš korak za korakom vodnik za ustvarjanje programske opreme, ki spreminja življenje, ne da bi vam uničila življenje

Ne morete izboljšati svojih programskih veščin, kadar nikogar ne skrbi za kakovost programske opreme.

Zaščiteno skladiščenje

Trdi diski, ki jih uporabljamo danes in se zanašamo na tako visoko stopnjo, so postali v zadnjem desetletju bistveno bolj zanesljivi. Vendar pa še zdaleč niso nezmotljivi in ​​glede na to, za katero študijo morda verjamete, se zdi, da delujejo dlje časa pravilno, odvisno od številnih dejavnikov. (Odlična mnenja o tem najdete tukaj na spletnem mestu Remarketer.) Če je omogočeno podrobno poročanje in pogon posreduje povratne informacije o napakah, so pokvarjeni sektorji in napake pri branju / pisanju ključni za odkrivanje, ko je disk znotraj shranjevalnega niza. ne uspeva. Druga pogosta težava v strežnikih, ki uporabljajo več diskov, povezanih na krmilnik RAID, je, da sam regulator ne bo uspel. Na žalost včasih trdi diski preprosto nehajo delovati brez kakršnega koli opozorila, kar je težko zanesljivo zaščititi.

Strežniki

Poleg pogonov, vgrajenih v strežnike in premikajoče se dele, kot so prej omenjeni hladilni ventilatorji in PSU-ji, se lahko v komponentah strojne opreme strežnika pojavi tudi več težav. Poročanje na ravni programske opreme (ki se običajno nanaša na BIOS ali drugo diagnostiko komponent strojne opreme nizke ravni) je ključnega pomena za opazovanje, ko stvari niso uspele ali, kar je še pomembneje, kažejo znake, da ne uspejo. Eno od vprašanj, ki morda ni takoj očitno, je tisto, ki zadeva matične plošče. Smiselno je, da stroji ne marajo preveč toplote. Toda tudi danes, če je sodobna vezja izpostavljena hitri izgubi toplote - ali postane zelo vroča, da nenadoma postane hladna - se lahko pojavijo razpoke, zaradi česar plošča katastrofalno ne bo uspela. Upoštevati je treba to, še posebej, če premikate opremo med stavbami znotraj vzdrževalnih oken, ki niso odpuščajoč.

MTBF: Prepusti lahko preveč

Tako kot koristne napovedi MTBF je pomembno izračunati sprejemljivo tveganje z vsako opremo, na katero se mora podjetje zanašati. Na žalost, tudi ob vseh statističnih zagotovilih proizvajalcev, je edini konkreten način, da zagotovite razpoložljivost opreme, ki poganja kritične sisteme, s podvojitvijo, da se omogoči prekinitev časovne omejitve.

Vsak posamezen kos strojne opreme, ki se uporablja v podjetju, je sestavljen iz različnih komponent, zato pravi MTBF še zdaleč ni nepomemben izračun. Jasno je, da je pri teh meritvah verjetnosti ključnega pomena, da se ne bodo spopadali s poslovno prihodnostjo, temveč jih uporabljamo kot merilo za sprejemanje premišljenih odločitev v zvezi z neprekinjenim poslovanjem in postopki za obnovo po nesrečah. Konec koncev, zmanjšanje izpadov s natančnim vnaprejšnjim načrtovanjem lahko pomeni razliko med uspešnim poslovanjem in poslovnim neuspehom.