Broadcom, specialista tecnologico globale che progetta, sviluppa e fornisce soluzioni software per semiconduttori e infrastrutture, ha lanciato VMware Cloud Foundation (VCF) 9.1, una piattaforma infrastrutturale sicura e conveniente per workload AI in produzione. VCF 9.1 offre una piattaforma di private cloud nativa per AI e Kubernetes, con sicurezza integrata e supporto per infrastrutture di calcolo eterogenee su AMD, Intel e NVIDIA. Questo consente alle aziende di implementare applicazioni di inferenza e AI agentica con costi significativamente ridotti, maggiore sicurezza e la libertà di scegliere le migliori soluzioni hardware GPU e CPU disponibili.
Un’anteprima del report “Private Cloud Outlook 2026” di Broadcom evidenzia come il cloud privato continui a essere la piattaforma preferita per i workload AI in produzione. Oltre la metà delle organizzazioni intervistate (56%) esegue o prevede di eseguire workload di inferenza in produzione su cloud privato. Ancora più significativo, l’utilizzo del cloud pubblico per l’inferenza in produzione si attesta al 41%, in calo di 15 punti percentuali su base annua. Inoltre, il 62% dei responsabili IT dichiara di essere molto o estremamente preoccupato per i costi dell’infrastruttura di AI generativa, mentre il 36% segnala che l’AI sta introducendo nuovi requisiti in termini di protezione dei dati, privacy, controlli di sicurezza e gestione del rischio.
VMware Cloud Foundation offre un’alternativa migliore al cloud pubblico per i workload in ambienti di produzione, grazie a un software intelligente che massimizza l’efficienza dell’infrastruttura sui server esistenti, garantendo al contempo controllo architetturale e conformità normativa, elementi essenziali per le implementazioni di AI in produzione.
VMware Cloud Foundation 9.1 consentirà alle aziende di eseguire workload in produzione, inclusi quelli di inferenza e AI agentica, con:
· Fino al 40% di riduzione dei costi dei server, grazie al tiering intelligente della memoria per cluster che eseguono workload AI e non AI¹
· Fino al 39% di riduzione del TCO dello storage, grazie a funzionalità avanzate di compressione e deduplicazione per le pipeline dati AI¹
· Fino al 46% di riduzione dei costi operativi di Kubernetes, per l’esecuzione di workload AI su larga scala¹
· Aggiornamenti dei cluster fino a 4 volte più rapidi e capacità della flotta raddoppiata, per scalare rapidamente l’infrastruttura AI¹
“Con sempre più aziende che si affidano all’AI per ottenere un vantaggio competitivo, emergono tre sfide cruciali: la privacy dei dati e della proprietà intellettuale, l’aumento dei costi infrastrutturali e la preparazione all’era dell’AI agentica”, ha dichiarato Krish Prasad, Senior Vice President e General Manager della VMware Cloud Foundation Division di Broadcom. “VCF 9.1 è una piattaforma unificata che affronta tutte e tre queste sfide e offre una delle infrastrutture più avanzate per la Private AI. Abilitiamo una sicurezza zero-trust per l’AI, riduciamo i costi grazie all’ottimizzazione intelligente dell’infrastruttura e alla libertà di scelta dell’hardware, e garantiamo la flessibilità necessaria per eseguire sia workflow agentici sia inferenza accelerata sulla stessa piattaforma”.
Infrastruttura efficiente su larga scala per workload di intelligenza artificiale
VCF 9.1 massimizza la densità sia per workload AI su macchine virtuali (VM) sia per quelli containerizzati sull’infrastruttura esistente, riducendo significativamente la complessità operativa. Grazie alla gestione intelligente delle risorse e all’automazione delle operazioni, le aziende possono eseguire più workload in produzione sui server esistenti, scalare in modo efficiente in ambienti distribuiti ed evitare costose espansioni infrastrutturali in un contesto di carenza di hardware e aumento dei costi.
Le funzionalità principali includono:
· Ottimizzazione intelligente delle risorse, che massimizza l’utilizzo dell’infrastruttura grazie a memory tiering avanzato e compressione storage di nuova generazione per le pipeline dati AI, consentendo una maggiore densità dei workload senza compromettere le prestazioni né richiedere costosi refresh hardware.
· Operazioni automatizzate su larga scala, che raddoppiano la capacità di gestione fino a 5.000 host e accelerano fino a 4 volte gli aggiornamenti dei cluster in ambienti distribuiti e air-gapped, eliminando l’overhead del patching manuale e supportando una rapida espansione dell’infrastruttura AI.
· Infrastruttura multi-tenant per l’isolamento AI, che consente ad aziende e service provider di eseguire più progetti e clienti su un’infrastruttura condivisa con rigorosi confini di sicurezza, massimizzando l’utilizzo delle risorse GPU e CPU e supportando la sovranità dei dati per i modelli sensibili.
· Integrazione in un ecosistema aperto, che abilita la scelta di GPU multi-acceleratore tra AMD e NVIDIA, supporta le principali piattaforme CPU AMD e Intel e garantisce interoperabilità EVPN e VXLAN basata su standard con Arista Universal Cloud Network, a conferma dell’impegno di VCF nel fornire connettività ad alte prestazioni e flessibilità di calcolo per l’AI in produzione.
· Networking ad alta velocità per carichi di lavoro AI grazie al supporto di VCF per le NIC NVIDIA ConnectX-7 e NVIDIA BlueField-3 con Enhanced DirectPath I/O. Con questo miglioramento vengono abilitati l’addestramento di modelli AI multi-host ad alta velocità e il trasferimento dati, fondamentali per i carichi di lavoro Gen AI più esigenti.
· Bilanciamento del carico e sicurezza virtualizzati con VMware Avi Load Balancer² e VMware vDefend², che eliminano la necessità di appliance hardware per endpoint di inferenza AI e applicazioni agentiche, riducendo il CapEx e offrendo resilienza di livello enterprise e gestione automatizzata del ciclo di vita.
App delivery ad alta velocità: piattaforma moderna per AI, container e VM
VCF 9.1 offre una piattaforma unificata che accelera il deployment delle applicazioni AI eseguendo workload di inferenza, applicazioni agentiche, servizi containerizzati e macchine virtuali tradizionali su un unico livello infrastrutturale. Questo elimina la frammentazione operativa e i costi legati alla gestione di stack separati, garantendo al contempo la developer velocity e la governance della piattaforma richieste dall’AI in produzione.
Le funzionalità principali includono:
· Scalabilità e performance Kubernetes per l’AI che garantiscono una scalabilità dei cluster 2,6 volte superiore, deployment più veloci del 70%, finestre di upgrade ridotte del 75% rispetto alle versioni di preview¹ e scalabilità continua che abilita zero downtime per i servizi AI in produzione.
· Gestione del compute eterogeneo che supporta in modo efficiente sia workload di AI agentica CPU-intensive sia inferenza accelerata su GPU in una piattaforma unificata, rispondendo al fatto che i workload agentici richiedono significativamente più capacità CPU rispetto alla GPU per l’esecuzione dei workflow e l’orchestrazione delle decisioni.
· AI observability e governance che fornisce metriche dettagliate su time to first token, token throughput e utilizzo GPU su diversi tipi di acceleratori, consentendo alle aziende di massimizzare il ROI infrastrutturale attraverso un monitoraggio preciso dell’hardware, mentre l’injection centralizzata delle policy e i controlli di sovranità dei dati abilitano enforcement della compliance AI e accesso sicuro ai modelli.
· Live application stack blueprint che catturano applicazioni multi-VM come template riutilizzabili per un rapido provisioning degli ambienti, eliminando errori di configurazione manuale e prevenendo configuration drift tra ambienti di sviluppo, test e produzione, accelerando al contempo la delivery dell’infrastruttura.
Architettura Zero Trust per la sovranità e la governance dei dati AI
VCF 9.1 integra la sicurezza a livello infrastrutturale per proteggere workload AI, modelli proprietari e dati di training, dall’hypervisor fino all’applicazione. Grazie a segmentazione zero-trust, sovereign recovery e patching continuo senza strumenti aggiuntivi, VCF rafforza la postura di sicurezza essenziale per le implementazioni AI in produzione, che gli ambienti di public cloud non sono in grado di eguagliare.
Le funzionalità principali includono:
· Ransomware recovery on-premises che fornisce ambienti di ripristino isolati e strumenti di validazione integrati, incluso il nuovo supporto per CrowdStrike Falcon Endpoint Security, proteggendo modelli AI e training data — asset di proprietà intellettuale altamente sensibili — dal trasferimento transfrontaliero, evitando al contempo elevati costi di bandwidth durante il disaster recovery.
· Continuous compliance enforcement1 che garantisce l’aderenza normativa tramite monitoraggio centralizzato e remediation automatizzata dello state desiderato per workload e componenti dello stack VCF, consentendo alle aziende di dimostrare readiness per audit su deployment AI in produzione senza overhead manuali o strumenti di compliance separati.
· Zero-downtime live patching che supporta fino all’80% dei casi d’uso senza host evacuation o maintenance window, eliminando le interruzioni dei servizi di AI inference in produzione e delle applicazioni agentiche che richiedono disponibilità continua per gli SLA.
· Zero-trust lateral security² che estende per la prima volta la protezione IDS/IPS distribuita ai workload AI su Kubernetes, offrendo 9 Tbps di capacità di threat inspection per inference distribuita e un incremento 5x nell’identificazione delle applicazioni per ambienti private cloud e Internet applications¹.
· Sicurezza self-service con automazione² che offre tagging centralizzato, profili di sicurezza predefiniti, configurazioni firewall delegabili e protezione delle applicazioni web in ingresso, consentendo ad aziende e service provider di mettere in sicurezza i deployment AI senza complessità operative né frammentazione degli strumenti di sicurezza.
Note
1- Basato su stime interne Broadcom o risultati di test; soggetto a modifiche. Aprile 2026
2- Servizio avanzato per VCF venduto separatamente


