NVIDIA avvia la produzione della piattaforma Vera Rubin: cosa cambia per gli agenti AI

nvidia vera rubin agenti ai gpu

NVIDIA ha annunciato l'inizio della produzione su larga scala della piattaforma Vera Rubin. Il sistema POD offre un throughput decuplicato rispetto a Grace Blackwell e introduce l'innovativa tecnologia Spectrum X Ethernet Photonics per connettere milioni di GPU.

Il mercato dell’intelligenza artificiale si prepara a un nuovo salto generazionale sul fronte dell’infrastruttura hardware. Dal palco del GTC di Taipei, oltre a nuovi superchip, NVIDIA ha confermato l’avvio della produzione su larga scala della piattaforma NVIDIA Vera Rubin, un ecosistema progettato specificamente per alimentare i pesanti flussi di lavoro basati sull’intelligenza artificiale agentica. Per soddisfare la domanda di fornitori cloud e laboratori di ricerca, l’azienda californiana ha mobilitato l’intera filiera produttiva globale, coinvolgendo i principali produttori di server taiwanesi e oltre trecentocinquanta fabbriche distribuite in trenta paesi.

Le novità di Vera Rubin: architettura POD e salto prestazionale

Il nucleo tecnologico del nuovo annuncio risiede nella struttura di calcolo. NVIDIA ha ingegnerizzato Vera Rubin come un ecosistema su scala POD, ovvero un blocco composto da cinque rack indipendenti configurati per operare in totale sincronia come un singolo supercomputer. Questa architettura unifica i sistemi NVL72, i processori Vera CPU, le unità Groq 3 LPX e l’infrastruttura di archiviazione BlueField-4 STX in un blocco monolitico.

Il risultato di questa profonda integrazione hardware si traduce in un netto incremento di potenza bruta. Secondo i dati tecnici rilasciati dall’azienda, il sistema garantisce un throughput decuplicato per le operazioni agentiche rispetto alla precedente generazione basata sulla piattaforma Grace Blackwell. Tale potenza si rende necessaria per gestire le nuove tipologie di prompt complessi, comandi in grado di innescare migliaia di passaggi logici autonomi, elaborazione degli strumenti e generazioni di risposte concatenate.

Leggi anche:  AI e guerra: perché il conflitto tra Anthropic e Pentagono cambia tutto

La rivoluzione ottica di Spectrum X Ethernet Photonics

Per consentire la comunicazione senza colli di bottiglia all’interno di reti composte da milioni di GPU, NVIDIA ha introdotto i primi switch commerciali basati su ottica co-pacchettizzata, una tecnologia nota con l’acronimo CPO, dotati di canali SerDes a 200 Gigabit al secondo. Questa innovazione di rete, commercializzata sotto il nome di Spectrum X Ethernet Photonics, abbandona i tradizionali ricetrasmettitori ottici per offrire un’efficienza energetica cinque volte superiore e ridurre contestualmente i tempi di implementazione nelle server farm.

A instradare il traffico dati interviene anche la nuova linea di DPU BlueField-4, capace di raggiungere velocità di trasferimento fino a 800 Gigabit al secondo. Sfruttando l’isolamento multi-tenant integrato direttamente nel silicio, i gestori dei data center ottengono un controllo capillare sui cluster virtualizzati, semplificando la gestione della rete per partner infrastrutturali di primo piano come Oracle Cloud e CoreWeave.

Protezione crittografica e piattaforma DSX

L’addestramento e l’esecuzione di modelli aziendali richiedono standard di riservatezza stringenti, specialmente negli ambienti cloud condivisi. Per rispondere a questa criticità, il sistema Vera Rubin integra la tecnologia NVIDIA Confidential Computing sull’intera scala del rack. I dati in transito attraverso le interconnessioni NVLink vengono crittografati a livello hardware, fornendo un ambiente di esecuzione isolato e a prova di manomissione. La gestione delle policy di sicurezza, il rilevamento delle minacce in tempo reale e il paradigma zero-trust sono invece affidati alla piattaforma software DOCA, progettata per proteggere le memorie di contesto senza pesare sulle risorse computazionali delle CPU host.

Il dispiegamento fisico di queste immense fabbriche di calcolo sarà infine coordinato da NVIDIA DSX, un hub di progettazione che unisce modelli di riferimento certificati, simulatori e software infrastrutturale. L’obiettivo della suite è ottimizzare i consumi energetici e abbattere il costo computazionale dei singoli token generati dall’AI. Le prime spedizioni commerciali dei server basati su architettura Vera Rubin prenderanno il via a partire dal prossimo autunno, segnando l’inizio di un nuovo ciclo di investimenti nel settore del computing ad alte prestazioni.

Leggi anche:  Apple rischia multa record di 38 miliardi