Big Data: perché prendere in considerazione l’Open Source

Il software open source in molti casi è la scelta principale, piuttosto che quella alternativa. Qui una riflessione di Massimo Tripodi di Talend Italia

A cura di Massimo Tripodi – Sales Country Leader Talend Italia

Negli ultimi anni si è verificata una rivoluzione silenziosa nel mondo della tecnologia: la popolarità del software open source è aumentata vertiginosamente dal momento in cui sempre più aziende hanno compreso il valore di abbandonare tecnologie proprietarie chiuse ed obsolete.

E non è un caso che questa trasformazione sia avvenuta in parallelo con l’esplosione dell’interesse per big data e analitiche. La natura modulare, fluida e in costante evoluzione dell’open source va di pari passo con le esigenze di progetti analitici innovativi per sistemi e piattaforme più rapidi, flessibili e, importantissimo, più sicuri, con cui implementarli.

Chi sono gli utenti dell’Open Source?

Non facciamoci fuorviare dal fatto che siccome è gratuito, il software open source sia un software per principianti. Oltre a eserciti di volontari che lavorano sui progetti nel loro tempo libero, anche un gran numero di lavoratori professionisti è pagato per farlo. Colossi nel settore della tecnologia, come IBM, Microsoft e Google sono alcune delle aziende più entusiaste che contribuiscono in termini di ore uomo ai più grandi progetti open source come Apache Hadoop e Spark.

Relativamente al coinvolgimento di queste grandi aziende nell’open source, Ciaran Dynes, vice president of products di Talend, sottolinea come “Il fatto interessante è che i loro modelli di business non dipendono dalla “proprietà” del software. L’open sourcing del software è una conseguenza della loro necessità di innovare per rispondere a un gap di mercato che hanno identificato, per esempio Google Search.

“L’open sourcing è una parte della loro attività e riconoscibilità sul mercato quale azienda di successo di cui far parte. Tale processo è abbastanza diverso tra i vendor, come Talend o Redhat, dove l’utilizzo dell’open source è stato quello di seminare il mercato con la propria tecnologia per sconvolgere lo status quo dei vendor proprietari”.

Molti progetti open source di successo legati ai big data in realtà hanno avuto inizio come iniziative interne delle aziende tecnologiche, per esempio, l’engine di query Presto che è stato sviluppato in Facebook prima di essere rilasciato pubblicamente e adottato, tra gli altri, da Netflix e AirBnB per gestire le attività di analitiche back end.

L’open source spesso può anche essere più flessibile dei software proprietari. Poiché il codice, trasferito e ottimizzato da migliaia di collaboratori esterni, è spesso estremamente efficiente, richiede anche minori risorse e potenza di elaborazione rispetto al software proprietario che esegue le stesse attività. Ciò significa che sistemi hardware e sistemi operativi possono essere aggiornati con minor frequenza al fine di assicurarsi di poter eseguire il software.

Internet è basata sul software open source – e allo stesso modo ha permesso all’open source di iniziare a raggiungere il suo potenziale riunendo programmatori di tutto il mondo e consentendo loro di collaborare l’uno con l’altro. Un settore intero si è sviluppato intorno ad alcuni dei prodotti open source più popolari – nel caso dei big data, Hadoop e Spark – volti ad aiutare le aziende ad ottenerne il massimo. Tali aziende tipicamente producono distribuzioni aziendali di prodotti open source che, a pagamento, vengono adattati per mercati specifici o con servizi di consulenza predefiniti per aiutare i loro clienti a trarne i maggiori benefici.

Tutto ciò significa che è più semplice che mai avere a che fare con il software open source e in molti casi è la scelta principale, piuttosto che quella alternativa. Lo scorso anno un sondaggio condotto tra 13.000 professionisti di tutti i settori ha rilevato che il 78% si è affidato alla tecnologia open source per gestire le proprie aziende, vale a dire un incremento del 100% rispetto al 2010.