Come garantire la resilienza nell’Edge Computing?

Il Cloud non ha eliminato i problemi di affidabilità, ma li ha spostati. Una breve guida per calcolare quanto costa un malfunzionamento e presentare alcuni accorgimenti per aumentare la resilienza e garantire la continuità operativa

La diffusione dell'IoT, l'aumento del volume di traffico digitale e l'adozione sempre più diffusa di applicazioni basate sul cloud stanno rimodellando il panorama dei Data Center.

L'aumento della dipendenza da applicazioni basate sul cloud impone infatti alle imprese una ridefinizione del livello di ridondanza delle apparecchiature dell'infrastruttura fisica (alimentazione, raffreddamento, rete…) che restano all'interno in strutture periferiche ("edge").

La resilienza, ovvero la capacità di tollerare eventuali guasti, deve quindi essere valutata con un'attenzione diversa rispetto al passato.

 

Cloud non significa affidabilità

Migliaia di applicazioni aziendali critiche, che prima risiedevano nei Data Center interni, sono ora ospitate in Data Center su cloud.

Non tutte le applicazioni, però, sono passate sul cloud. E le ragioni di questa scelta sono svariate: in primo luogo la normativa, particolarmente stringente in alcuni ambiti. A questo si aggiungono la cultura aziendale, la necessità di mantenere all'interno alcune applicazioni proprietarie critiche o le esigenze di latenza…

Di conseguenza, gli ambienti dei Data Center possono essere definiti "ibridi", ossia:

  1. Data Center su cloud centralizzati

  2. Data Center regionali di medie-grosse dimensioni

  3. Data Center interni, localizzati, di dimensioni inferiori


Ciò che era un Data Center interno da 1 MW in una filiale aziendale, ora può essere costituito da un paio di rack di apparecchiature informatiche, che eseguono applicazioni critiche e/o forniscono la connettività di rete al cloud. La riduzione dell'ingombro e della capacità del Data Center interno, però, non dovrebbe comportare anche una riduzione della criticità, dal momento in che in alcuni casi le apparecchiature che rimangono all'interno acquisiscono un'importanza ancora maggiore.


Quanto vale una somma?

Un esempio emblematico del valore dell'affidabilità è rappresentato dalla disponibilità di due sistemi in serie, che dipende dalla disponibilità di entrambi. Può quindi essere calcolata con la semplice formula:


Disponibilitàsistema = Disponibilità1 × Disponibilità2


Per calcolare la disponibilità dei Data Center dal punto di vista di questo utente, la formula precedente può essere utile. Ad esempio, se la disponibilità del Data Center centrale è pari al 99,98% (Data Center Tier 3 con 1,6 ore di interruzioni) e la disponibilità del Data Center interno è pari al 99,67% (Data Center Tier 1 con 28,8 ore di interruzioni), le interruzioni totali per tale utente saranno 99,98% × 99,67% = 99,65% (30,7 ore di interruzioni). Ovvero più di un giorno all'anno!

 

Sicurezza, non solo logica

Accanto agli aspetti di sicurezza informatica, è altrettanto importante valutare i rischi fisici, spesso sottovalutati dalle PMI.

Alcuni Data Center locali sono collocati in ambienti altamente accessibili, ad esempio spazi per uffici condivisi, e senza uno spazio dedicato ai rack, che rimangono aperti senza misure di sicurezza. Queste situazioni pongono seri rischi per la sicurezza, sia per l'intervento di malintenzionati sia per il rischio di incidenti.

Da qui il consiglio di:

Spostare le apparecchiature in ambienti o armadi chiusi a chiave;

Predisporre un sistema di controllo accessi con tecnologie biometriche o altri metodi;

In ambienti difficili, proteggere le apparecchiature in armadi a prova di incendi, allagamenti, umidità, atti vandalici e campi elettromagnetici;

Implementare il monitoraggio 24/7 della sicurezza e dell'ambiente e la videosorveglianza.


Quanto costa un problema?

Se questi accorgimenti vi sembrano inutili, provate a effettuare un rapido calcolo, partendo da una disponibilità del 99,65%, come calcolata precedentemente. In questo caso 30,7 ore di interruzioni, a fronte di soli 20 dipendenti collegati, significano la perdita di oltre 600 ore di lavoro, ovvero un costo aziendale annuo di oltre 30mila euro. A cui si aggiungono i danni di immagine e le mancate vendite.

BitMAT mette a disposizione, insieme a Schneider Electric, un white paper gratuito per spiegare quali accorgimenti assumere per aumentare la resilienza e garantire la continuità operativa.

Per scaricare il white paper è sufficiente registrarsi a questo link.