Data warehouse in cloud: le best practices del 2019

Le elenca Talend, che le ha identificate in uno studio condotto da TDWI per comprendere come ottimizzarne il ROI

TDWI ha condotto un’indagine per conto di Talend sui nuovi data warehouse in cloud. Obiettivo: comprendere le prassi da seguire per affrontare le nuove sfide e aumentare il ritorno degli investimenti.

I CWD offrono, infatti, una capacità di dati più ampia, prestazioni più elevate e una maggiore flessibilità rispetto ai tradizionali database on-premise, ma benché siano spesso un primo passo importante verso la trasformazione digitale, occorre avere delle accortezze.

Pur dotati di scalabilità elastica, archiviazione agnostica, accesso multi-tenant e controllo dei costi, i data warehouse in cloud dovrebbero essere completati con una sostanziale infrastruttura di integrazione dati per unificare le diverse parti del warehouse con tutte le fonti di dati e in base agli obiettivi.

Esigenze articolate per un’ampia varietà di dati
I partecipanti al sondaggio oltre ad aver verificato che l’adozione dei data warehouse in cloud è stata fondamentale nell’ottenere prestazioni più rapide a costi inferiori e a sfruttare le funzionalità del cloud, hanno osservato anche una serie di sfide correlate al CDW. Oltre il 50% degli intervistati ha indicato la “governance dei dati” come una delle sfide principali, il 40% ha indicato “l’integrazione dei dati attraverso fonti multiple” e circa il 38% “l’inserimento dei dati nel warehouse”.

Le esigenze da parte delle aziende di analisi dei dati in un data warehouse in cloud stanno diventando sempre più articolate. Oltre il 35% degli intervistati ha espresso la necessità di avere l’elaborazione in memoria, il supporto per dati strutturati e non strutturati e l’integrazione di tool per le analisi di terze parti. Di conseguenza, i CDW devono accogliere un’ampia varietà di dati e servire una ampia gamma di casi d’uso.

È interessante notare che per il 62% degli intervistati nel processo di implementazione dei CDW desidera che sia integrato un data lake per le analisi. Tutti gli intervistati sono interessati a funzionalità quali la qualità dei dati, la gestione dei metadati, l’elaborazione e la trasformazione dei dati, sia prima sia dopo il caricamento degli stessi in un CDW. Poiché questi requisiti non possono essere soddisfatti solo dalle tecnologie CDW, come responso viene suggerita la necessità di adottare delle soluzioni di integrazione dati per completare l’infrastruttura. I data warehouse in cloud devono essere in grado di soddisfare una vasta gamma di casi d’uso, da quello commerciale a quello tecnico e di supportare gli incrementi in velocità e in scala, gestendo al tempo stesso le esigenze attuali e future.

Utilizzare i dati avendo come focus l’integrazione
Quando si adotta un CDW, occorre tenere presente le esigenze di architettura e integrazione dei dati. A differenza di alcune soluzioni, l’integrazione di Talend aiuta a ottimizzare e scalare l’elaborazione dei dati prima e dopo la loro collocazione in un CDW in modo da ottenere trasformazioni complesse e avanzate.