Disaster Recovery
Il servizio è rivolto agli aderenti che desiderano sottoporre a DR una o più delle loro macchine virtuali ospitate sul TIX. Le VM da proteggere, con le loro dotazioni di RAM, vCPU, e storage dovranno essere replicate sul sito secondario usando le tabelle di listino dal codice DR*. Il Data Center di Acilia, che si trova a circa 242 km in linea d'aria dal TIX, è stato dedicato alle soluzioni di DR in virtù sia delle infrastrutture in Tier IV (disponibilità pari a 99,995%), sia della distanza e, in caso di eventi catastrofici, assicurerà il mantenimento dell'integrità delle informazioni e la ripartenza dei servizi dal sito di DR.
Le funzionalità del DR implementate sono:
- Fail-over - switch sul sito di DR in seguito ad un failure del sito primario;
- Fail-back - switch back sul sito primario, una volta terminata l'emergenza;
La soluzione di DR è di tipo Active - Cold Standby (accesa, ma con i servizi applicativi in stand-by) per le infrastrutture IaaS che ospitano le VM dei servizi applicativi. Il meccanismo di replica è a livello di storage per la parte Bare Metal, VMware, ed OpenStack. La replica include anche tutte le configurazioni e i metadati richiesti da ciascuna componente e ne garantisce la consistenza. Le risorse di storage saranno impegnate per la quantità di dati replicati, mentre le risorse di calcolo saranno configurate, ma inattive/inutilizzate, e dovranno essere rese effettivamente disponibili solo al bisogno in coerenza con i tempi di RTO richiesti. Il layer di virtualizzazione storage utilizzato sarà IBM Spectrum Virtualize, che permette di implementare una replica asincrona verso il sito di DR (Acilia), su 4 canali a 10 GBE dedicati.
Sono previsti 4 livelli di servizio, corrispondenti a 4 diverse fasce di prezzo nel listino per tutte le risorse (VM, VCPU, RAM, storage) delle macchine virtuali che devono essere replicate 1:1 nel sito di DR:
Livelli di Servizio DR | A | B | C | D |
---|---|---|---|---|
RPO(*) | 1 Giorno | max 12h | max 4h | tra 0 e 5 minuti |
RTO(*) | max 1 settimana | max 3 giorni | max 24 ore | max 4 ore |
(*)RTO (Recovery Time Objective, corrisponde a quanto tempo ci si può permettere di restare con i propri sistemi essenziali offline prima che il blocco abbia ripercussioni sull'attività) e RPO (Recovery Point Objective, quanta parte dei dati contenuti all'interno di questi sistemi e applicazioni ci si possa permettere di perdere) I canoni sono onnicomprensivi, ovvero includono i costi