Disaster Recovery

Il servizio è rivolto agli aderenti che desiderano sottoporre a DR una o più delle loro macchine virtuali ospitate sul TIX. Le VM da proteggere, con le loro dotazioni di RAM, vCPU, e storage dovranno essere replicate sul sito secondario usando le tabelle di listino dal codice DR*. Il Data Center di Acilia, che si trova a circa 242 km in linea d'aria dal TIX, è stato dedicato alle soluzioni di DR in virtù sia delle infrastrutture in Tier IV (disponibilità pari a 99,995%), sia della distanza e, in caso di eventi catastrofici, assicurerà il mantenimento dell'integrità delle informazioni e la ripartenza dei servizi dal sito di DR.

Le funzionalità del DR implementate sono:

  • Fail-over - switch sul sito di DR in seguito ad un failure del sito primario;
  • Fail-back - switch back sul sito primario, una volta terminata l'emergenza;

La soluzione di DR è di tipo Active - Cold Standby (accesa, ma con i servizi applicativi in stand-by) per le infrastrutture IaaS che ospitano le VM dei servizi applicativi. Il meccanismo di replica è a livello di storage per la parte Bare Metal, VMware, ed OpenStack. La replica include anche tutte le configurazioni e i metadati richiesti da ciascuna componente e ne garantisce la consistenza. Le risorse di storage saranno impegnate per la quantità di dati replicati, mentre le risorse di calcolo saranno configurate, ma inattive/inutilizzate, e dovranno essere rese effettivamente disponibili solo al bisogno in coerenza con i tempi di RTO richiesti. Il layer di virtualizzazione storage utilizzato sarà IBM Spectrum Virtualize, che permette di implementare una replica asincrona verso il sito di DR (Acilia), su 4 canali a 10 GBE dedicati.

Sono previsti 4 livelli di servizio, corrispondenti a 4 diverse fasce di prezzo nel listino per tutte le risorse (VM, VCPU, RAM, storage) delle macchine virtuali che devono essere replicate 1:1 nel sito di DR:

Livelli di Servizio
Livelli di Servizio DR A B C D
RPO(*) 1 Giorno max 12h max 4h tra 0 e 5 minuti
RTO(*) max 1 settimana max 3 giorni max 24 ore max 4 ore

(*)RTO (Recovery Time Objective, corrisponde a quanto tempo ci si può permettere di restare con i propri sistemi essenziali offline prima che il blocco abbia ripercussioni sull'attività) e RPO (Recovery Point Objective, quanta parte dei dati contenuti all'interno di questi sistemi e applicazioni ci si possa permettere di perdere) I canoni sono onnicomprensivi, ovvero includono i costi