Proteggere i data center durante le festività: alcuni consigli da Vertiv

Vertiv spiega come proteggere dai tempi di fermo l’infrastruttura IT del settore Retail

Di Andrea Faeti, Service Sales Director di Vertiv per l’Italia

In passato i centri commerciali non preparavano gli addobbi e non accendevano le luci natalizie fino alla fine di novembre, dando ufficialmente il via alla stagione delle feste. Al giorno d’oggi, il caos delle feste inizia molto prima e molti retailer preparano le vetrine in abbinamento alla ricorrenza di Halloween. Ogni retailer deve però anche assicurarsi che la propria infrastruttura digitale sia pronta a supportare tutti coloro che faranno acquisti online per Natale.

Lo scorso anno, molti grandi retailer statunitensi, tra cui Walmart e Lowes, hanno imparato questa lezione a proprie spese, quando i loro siti si sono bloccati in modo anomalo durante il weekend del Ringraziamento. Il sito LovetheSale.com stima che le problematiche tecniche abbiano interessato più di 3,5 milioni di clienti e sono costate ai retailer 9 milioni di dollari in mancate vendite. Le proteste sui social media da parte dei clienti frustrati hanno solo peggiorato la situazione.

Anche se le anomalie dello scorso anno erano probabilmente dovute a un traffico sui siti retail superiore a quanto previsto, i retailer devono fare tutto il possibile per garantire la disponibilità della propria infrastruttura digitale a supporto delle transazioni di business durante il periodo dello shopping natalizio. Un sito di e-commerce temporaneamente rallentato è una cosa, ma un guasto completo o parziale del data center è un’altra storia, con conseguenze molto gravi.

Secondo l’ultimo report del Ponemon Institute Cost of Data Center Outages, il costo medio di un disservizio dei data center è aumentato costantemente fino a 740.000$, con data center che segnalano un costo medio di 9.000$ al minuto per incidente. Oltre all’incasso perso, queste spese includono il costo di rilevamento e correzione delle cause principali del disservizio, perdita di produttività e danni all’immagine. Un’interruzione del servizio è sempre una cattiva notizia, ma nelle settimane che precedono le festività, può trasformare il periodo più bello dell’anno in un vero e proprio incubo.

Alcuni suggerimenti su come proteggere il proprio data center anche durante le festività:

1. Ispezionare le risorse per valutarne le condizioni

Dato che molti retailer bloccano o limitano l’accesso ai propri data center da metà novembre fino a gennaio come misura preventiva per la protezione contro gli errori umani o i rischi di sicurezza, è opportuno far precedere questo periodo dalle attività di controllo affinché il data center sia pronto a gestire qualsiasi processo che potrebbe causare tempi di fermo, da un’interruzione di corrente a un guasto della rete.

Serve quindi iniziare con una verifica approfondita dei data center in loco, analizzando anche gli aspetti logistici legati alle infrastrutture edge multiple. L’assegnazione dell’incarico a manutentori opportunamente formati amplia il raggio d’azione delle ispezioni già previste dal contratto di servizio attivo e senza alcuna spesa aggiuntiva.

Di recente Vertiv ha aiutato un importante retailer a verificare il data center che supporta il suo centro di distribuzione e ha scoperto che metà dei gruppi di continuità (UPS, Uninterruptible Power Supply) presentavano problemi di affidabilità. Problemi critici ai sistemi di business continuity vanno scoperti ed affrontati quando si ha ancora il tempo di correggere i problemi prima di compromettere l’attività.

Oltre alle prestazioni dei sistemi di alimentazione e raffreddamento di un data center, i manutentori e i tecnici possono anche verificare altri eventuali problemi di infrastruttura che possono influenzare la disponibilità e le prestazioni dei sistemi critici.

Tali problemi includono la distribuzione di calore sui rack e su file di rack, la distribuzione dei flussi da aria e le eventuali ostruzioni dei pavimenti sopraelevati e dei condotti aeraulici. Possono essere identificate vulnerabilità legate agli isolamenti ed alla tenuta meccanica dei collegamenti elettrici con conseguente rischio di formazioni di interruzioni o di archi elettrici.

La conoscenza di questi problemi può aiutare i responsabili del data center a comprendere meglio il quadro generale dei rischi presenti sull’infrastruttura e a pianificare gli adeguamenti ed i miglioramenti necessari.

2. Utilizzare i risultati dell’audit per dare priorità agli aggiornamenti

In base a quanto appreso dall’audit dell’infrastruttura, è possibile sviluppare un vero risk assessment che stabilisca le priorità del budget IT per consentire gli aggiornamenti necessari e supportare la gestione generale delle risorse.

Poichè le cause principali e più costose dei tempi di inattività dei data center sono direttamente correlate alle vulnerabilità dell’infrastruttura di alimentazione e raffreddamento, è bene concentrare la propria attenzione su questi aspetti prima delle festività.

3. Considerare il ripristino, l’aggiornamento o la sostituzione delle unità UPS

Un gruppo di continuità affidabile, affiancato a una regolare manutenzione preventiva e a un costante monitoraggio, è la chiave per garantire la massima disponibilità dei sistemi. Infatti, le indagini di Vertiv dimostrano che anche una singola visita di manutenzione p

reventiva all’anno può aumentare di oltre dieci volte il tempo medio tra due guasti successivi (MTBF, Mean Time Between Failures). Gli audit aiuteranno a garantire la continuità dell’alimentazione determinando la necessità di sostituire preventivamente le batterie dell’UPS e altri componenti a rischio o, a seconda dello stato degli apparati e dell’ambiente operativo, la necessità di sostituire le unità stesse con altre di nuova generazione.

Identificata la necessità di sostituzione, è opportuno considerare investimenti in nuove batterie e tecnologie UPS che possano aumentare l’affidabilità intrinseca della soluzione, come le batterie agli ioni di litio, che offrono opportunità in termini di durata e di monitoraggio delle prestazioni. Possono anche essere rivalutati i piani di protezione dell’alimentazione, come ad esempio il Power Assurance Package di Vertiv, per una supervisione delle apparecchiature e rapidi tempi di risposta, a maggiore garanzia della continuità delle infrastrutture business-critical.

4. Verificare la presenza di un raffreddamento adeguato e la corretta strategia di raffreddamento

I disservizi dei data center relativi ai sistemi termici non sono sempre causati da guasti delle singole apparecchiature di raffreddamento. Spesso, tali eventi possono essere attribuiti a un’infrastruttura di raffreddamento inadeguata. L’ottimizzazione della strategia di raffreddamento può comportare la riconfigurazione delle risorse, il passaggio a soluzioni di raffreddamento di precisione distribuiti sulle file di rack o l’implementazione di sistemi di compartimentazioni del freddo.

E’anche possibile valutare l’investimento in nuove tecnologie e prodotti, che possano aiutare a velocizzare l’implementazione dei rapidi cambiamenti dell’infrastruttura IT che avvengono nel settore retail, come il nuovo sistema di raffreddamento in rack Vertiv™ VRC. Si tratta di una soluzione che si adatta rapidamente e facilmente alle necessità dei sistemi edge con una soluzione plug-and-play, rendendo possibile il raffreddamento in spazi e ambienti non adatti a prodotti di raffreddamento tradizionali.

5. Aggiungere un livello di supervisione

Più le reti IT diventano distribuite, più è difficile per i reparti IT interni gestire ogni apparecchiatura in ogni luogo. Oggi esistono molte soluzioni software e hardware che consentono la gestione ed il monitoraggio remoto delle prestazioni delle apparecchiature da posizioni centralizzate. Questa caratteristica può essere particolarmente importante per i retailer che limitano l’accesso fisico al data center durante le festività.

I fornitori di servizi come Vertiv offrono anche una serie di programmi come Vertiv LIFE Services per monitorare le condizioni di funzionamento e lo stato delle apparecchiature di alimentazione e dell’infrastruttura di raffreddamento. Tale monitoraggio può segnalare i potenziali problemi prima che questi causino interruzioni dei servizi, ottimizzando così l’efficienza del personale IT.

Prepararsi alle feste senza tempi di fermo

Grazie alle verifiche specialistiche, alla manutenzione preventiva e al monitoraggio del data center, le aziende retail potranno posizionarsi opportunamente per supportare le applicazioni critiche per tutta la stagione ed evitare l’impatto negativo sul business causato da tempi di fermo inattesi ed inopportuni. Potranno dunque offrire ai propri clienti siti di e-commerce affidabili garantendo allo stesso tempo per la propria attività una stagione natalizia affollata e redditizia.