Claudio Brotto

Single Point of Failure

Giusto per citare il buon ragionier UgoF, "dicesi" single point of failure "a component in a device, or a point in a network, that, if it were to fail would cause the entire device or network to fail; normally eliminated by adding redundancy" (wikipedia).

Concetto estremamente semplice che si illustra bene con un esempio.

Perchè un server (tipicamente) ha l'alimentatore ridondato ?

Perchè se l'alimentatore principale si guasta quello secondario subentra senza causare interruzioni del servizio.

Un servizio che va down anche per pochi minuti può violare qualche SLA firmato col cliente (al quale è stato garantito un uptime del 99,99% ...).

Un servizio che va down può far perdere un sacco di soldi (che succede se va in tilt il sistema di gestione dei telepass e non si apre più la sbarra ? beh ... che le autostrade sono costrette ad aprire tutte le sbarre senza far pagare il pedaggio).

Credo ci siano pochi dubbi sul fatto che (vedi definizione sopra) i sistemi vadano ridondati per eliminare la eventualità di un fallimento.

Ho sottolineato eventualità perchè non sempre la cosa è percepita come probabilità. Ma questo è un altro discorso.

Il mio pensiero della mattina invece è un altro.

E parte dalla domanda che segue: siamo sicuri che un sistema sia costituito solamente da device, software e via dicendo ?

Dire che un componente di un sistema è la persona è così sbagliato ?

Me lo chiedo perchè un sacco di ambienti che ho visto hanno server ultraridondati, switch ultraridondati, dischi ultraridondati, backup di tutti i tipi ...

Ed è un bene !

Ma mai che nessuno pensi a ridondare le persone !

Giacchè si dà il caso che gli alimentatori si fondano e che le persone si ammalino.

E di sicuro gli alimentatori non si licenziano !

E altrettanto di sicuro (e questo è il punto chiave) se un alimentatore non ridondato si rompe, si subisce un'interruzione del servizio (molto male) ma in seguito lo si sostituisce (almeno il servizio riprende).

E' altrettanto facile sostituire le persone ?

Basta fare un ordine al proprio rivenditore col numero di serie del componente che si è rotto ?

Posted: set 04 2007, 11.17 by devlizard | with 1 comment(s)
Filed under:

Comments

igor said:

E pensare che un server (incluso l'alimentatore ridondato) è finalmente considerato come un "asset" aziendale... e non è (spesso) altrettanto per le persone.

Soprattutto nelle aziende di produzione questa è una triste considerazione comune: i macchinari sono il valore, visto che servono per produrre... lo so fa tanto "rivoluzione industriale" ma è ancora così, in molti casi.

Analogamente non si percepisce il valore della formazione... ed il costo della "non-formazione".

# novembre 1, 2007 7.55