Cloudera Altus è pronta per Microsoft Azure

Cloudera Altus Data Engineering per Azure abilita nuovi flussi di lavoro per l’analisi dei dati ibridi e multi-cloud senza rischio di incompatibilità

La versione beta di Cloudera Altus Data Engineering sarà presto disponibile per la piattaforma cloud Microsoft Azure.
Lo ha reso noto il fornitore globale della piattaforma per l’apprendimento automatico, analisi avanzate e data management costruita per il cloud che, con Cloudera Altus propone una soluzione PaaS basata sulla distribuzione di Cloudera Enterprise per supportare gli ingegneri dei dati.

Grazie alla sua soluzione, quest’ultimi saranno in grado di utilizzare l’infrastruttura cloud on-demand per velocizzare la creazione e la gestione di pipeline di dati che alimentano sofisticate applicazioni.

Altus per Azure offre, infatti, una gestione dei dati semplice, unificata e pronta per l’azienda, permettendo agli utenti finali una scelta più ampia nei fornitori di infrastrutture cloud.

Verso l’analisi predittiva dei dati
Si tratta dell’ultima delle molte collaborazioni già avviate tra Cloudera e Microsoft. Oltre ad Altus, infatti, gli analisti possono analizzare i dati dei sensori tramite IoT Hub, estrarre i dati elaborati da Cloudera in Microsoft SQL Server tramite Polybase e visualizzare le intuizioni utilizzando Microsoft Power BI per Impala. Inoltre, grazie a questa integrazione con Microsoft, Cloudera offre alle aziende strumenti di machine learning in grado di supportare l’analisi dei dati su larga scala e l’analisi predittiva.

Cloudera Altus Data Engineering per Azure, in particolare, semplifica lo sviluppo e l’operatività delle pipeline di dati, concentrandosi sui carichi di lavoro dell’ingegneria dei dati, ma sottraendo al contempo la gestione e le operazioni dell’infrastruttura che possono essere complesse e dispendiose in termini di tempo.

I clienti sono in grado di ospitare i propri data lakes su Azure Data Lake Store (ADLS), il sistema di storage in cloud e in hyperscale per l’analisi dei dati, e di utilizzare la capacità dell’infrastruttura Azure on-demand richiesta dall’utente finale in modalità self-service. Separando calcolo e storage, inoltre, ADLS è in grado di scalare le risorse in modo indipendente per i casi di utilizzo più impegnativo da parte del cliente.

Poiché Altus è supportato dalla distribuzione Cloudera Enterprise, Altus riduce il rischio associato alle migrazioni cloud e alle migrazioni dei carichi di lavoro tra i provider cloud. Altus, infine, fornisce agli utenti strumenti familiari e consente la gestione condivisa dei metadati e l’archiviazione attraverso la pipeline di dati.

I vantaggi di Altus Data Engineering per Azure includono:
●     Orientamento al carico di lavoro: Altus si focalizza sulla costruzione di pipeline di dati piuttosto che sull’amministrazione di cluster o infrastrutture, affinché gli utenti possano facilmente inviare, replicare e risolvere problemi senza toccare l’infrastruttura sottostante.
●     Nessun silos di dati: Altus consente agli ingegneri di eseguire lavori di elaborazione dei dati che leggono e scrivono direttamente su ADLS. Questi dati sono immediatamente disponibili per l’utilizzo da parte di altri motori di calcolo di Cloudera senza richiedere la replica dei dati, l’ETL o modifiche ai formati di file, ed elimina i costi di gestione della memorizzazione degli stessi dati più volte. In questo modo gli utenti possono integrare in modo più efficiente l’ingegneria dei dati nelle proprie applicazioni di data science, BI e applicazioni DB in tempo reale.
●     L’integrazione con i più diffusi strumenti di terze parti fornisce funzionalità avanzate senza rischio di incompatibilità.
●     Analisi del carico di lavoro integrata: Altus fornisce funzionalità di monitoraggio e risoluzione dei problemi per pipeline di dati grazie all’analisi del carico di lavoro. L’analisi del carico di lavoro, infatti, consente agli utenti di risolvere facilmente i problemi relativi ai lavori non andati a buon fine e può segnalare le anomalie delle prestazioni dei carichi di lavoro ed eseguire l’analisi delle cause alla radice. In questo modo i clienti possono gestire i propri dati con maggiore affidabilità e costi inferiori.