Ho iniziato ad installare server con Novell NetWare 2.x
La società per cui lavoravo in quel periodo quando doveva vendere piccole soluzioni forniva un Compaq Deskpro 286 su cui veniva installato l’applicativo di NetWare 2. I PC avevano, ovviamente un solo disco che durava spesso più dell’applicativo che supportavano. Naturalmente si facevano i backup, spesso sui dischi locali dei PC.
Poi siamo passati a Novell NetWare 3.x, installati o su Deskpro 386 oppure, per i più facoltosi, su Compaq SystemPro, tra i primi “PC” in fatti per essere “server”. Anche in questo caso si installava un solo disco, che durava per anni (sempre con il suo bravo backup, si capisce). Solamente verso il 1994 ho installato i primi RAID di Compaq: gli IDA, precursori degli Smart Array Controller che hanno dimostrato infinite volte di meritare il loro nome di battesimo.
Nella seconda metà degli anni 90, con l’esplosione dei server il RAID diventa quasi obbligatorio, sia perché chi vende vende più dischi sia perché i dischi diventano meno robusti sia perché inizia la frenesia, spesso ingiustificata, dello zero downtime. Si mette tutto ridondante: alimentatore, dischi, NIC, così il server può funzionare senza problemi 24x7x365, magari con un contratto di assistenza analogo. E poi l’azienda lavora 40 ore la settimana e nessuno controlla se il server ha dei guasti, ma questo è un altro discorso.
Con l’avvento sul finire del millennio di enclosure che permettono RAID da 14 dischi si fa avanti l’idea del disco di spare: un disco pronto ad entrare in azione se uno (o più) dei volumi RAID degrada per guasto di un disco. Abbiamo quindi dei dischi in più per ridondanza (il doppio nel caso di RAID1[0], uno solo nel caso di RAID5) a cui si aggiungono altri dischi di hot spare.
Alla fine del 2000 (vado a memoria) Compaq introduce la SMART 6300 con la funzionalità ADG, che altri chiamano RAID6: in pratica la ridondanza distribuita è gestita in modo tale da poter perdere anche due dischi e mantenere il volume RAID leggibile, anche se degradato, ovviamente i dischi che si “perdono” sono due. Se l’ADG è una sorta di hot spare online, molti preferiscono avere sia ADG sia hot spare.
Le dimensioni dei dischi crescono geometricamente, ma non sono seguite da un’altrettanta crescita della banda delle interfacce e dei controller; contestualmente si fanno sentire le iniziative di contrazione dei costi di gestione, le ottimizzazioni della logistica e tutte queste cose.
Adesso è normale che un fornitore consegni un server con tutti i dischi di un RAID non solo della stessa marca e modello, ma anche dello stesso lotto di produzione, il che significa che la probabilità che si guastino relativamente assieme è altissima. Infatti è successo tre volte dall’inizio dell’anno a dei clienti (molto diversi tra loro) di una ditta con cui collaboro. La dimensione di un disco è diventata tale per cui ci possono volere decine di ore per ricostruire un RAID; le impostazioni di default dei controller che privilegiano le performance rispetto alla ricostruzione non aiutano.
Qualcuno comincia timidamente a sussurrare che la ridondanza con parità distribuita (RAID 5/6) non è più adatta e bisogna adottare solamente ridondanza per copia (RAID 1/1+0/0+1). Un po’ come quando CISCO in ogni configurazione che propone dopo ogni dispositivo aggiunge “due, per ridondanza”: come (cercare di) raddoppiare le vendite scaricando sul cliente i problemi di un calo della qualità del prodotto.
Lascia un commento