GPT-5.4: OpenAI lancia il suo modello più potente per il lavoro professionale

GPT-5.4 rappresenta la convergenza in un unico sistema di tutti i progressi recenti di OpenAI in tre aree chiave — ragionamento, coding e workflow agentici. Il modello incorpora le capacità di programmazione di GPT-5.3-Codex e le combina con miglioramenti sostanziali nella gestione di documenti, fogli di calcolo, presentazioni e ambienti software complessi.

OpenAI si trova in un momento delicato. Dopo le polemiche scaturite dalla decisione di offrire i propri servizi al Dipartimento della Difesa degli Stati Uniti — una scelta che ha fatto perdere alla piattaforma circa 1,5 milioni di utenti e ha generato tensioni interne tra i dipendenti — l’azienda ha deciso di rispondere sul piano tecnologico con il lancio di GPT-5.4, il suo nuovo modello di frontiera pensato per il lavoro professionale.

Il modello è disponibile in tre versioni distinte:

GPT-5.4 (Thinking) — disponibile da subito per gli utenti ChatGPT Plus, Team e Pro, in sostituzione di GPT-5.2 Thinking. Quest’ultimo resterà accessibile come modello legacy fino al 5 giugno 2026.
GPT-5.4 Pro — pensato per chi richiede le massime prestazioni su attività complesse, disponibile tramite API e per i piani ChatGPT Enterprise ed Edu.
GPT-5.4 via API — con una context window estesa fino a 1,05 milioni di token, la più ampia mai offerta da OpenAI, e un massimo di 128.000 token in output.

Il modello è in distribuzione graduale su ChatGPT, API e Codex a partire dal 5 marzo 2026.

La novità più importante: il computer use nativo

Tra tutte le novità introdotte, quella che segna il cambiamento più profondo è la computer use nativa. GPT-5.4 è il primo modello general-purpose di OpenAI progettato per controllare direttamente un computer: può interagire con software, siti web e strumenti digitali, impartire comandi da tastiera e mouse, eseguire codice e verificare autonomamente i risultati in un ciclo build-run-verify-fix.

Questo significa che un agente basato su GPT-5.4 non si limita a rispondere a una domanda o generare testo: può operare all’interno delle applicazioni come un assistente umano. Per chi sviluppa sistemi AI agentici, si tratta di un salto qualitativo considerevole.

I risultati sui benchmark specializzati confermano questo avanzamento: GPT-5.4 raggiunge il 75% su OSWorld-Verified, superando la performance umana attestata al 72,4%, e ottiene il 67,3% su WebArena-Verified, contro il 65,4% della versione precedente.

Benchmark e numeri: cosa dicono i dati ufficiali

OpenAI ha pubblicato una serie di confronti diretti tra GPT-5.4 e le versioni precedenti. I risultati più significativi riguardano:

GDPval — benchmark che valuta la capacità di svolgere attività tipiche di 44 professioni in 9 settori economici: GPT-5.4 raggiunge l’83% di risultati pari o superiori a quelli di professionisti umani, contro il 70,9% di GPT-5.2.
Fogli di calcolo — nelle simulazioni di attività da analista, il modello ottiene un punteggio medio dell’87,3%, contro il 68,4% di GPT-5.2.
Presentazioni — nel 68% dei casi, i valutatori umani hanno preferito gli output di GPT-5.4 rispetto alla versione precedente, citando migliore qualità visiva e maggiore varietà grafica.
Accuratezza fattuale — le singole affermazioni prodotte dal modello risultano 33% meno probabilmente errate rispetto a GPT-5.2, e le risposte complete sono 18% meno soggette a contenere inesattezze.

Sul fronte del coding, GPT-5.4 integra le capacità di GPT-5.3-Codex e, in Codex, è disponibile anche una modalità /fast che aumenta la velocità di generazione fino a 1,5 volte, utile nelle fasi di debugging iterativo.

Tool Search: gestione intelligente degli strumenti esterni

Un’altra innovazione tecnica rilevante è Tool Search, un nuovo sistema di gestione degli strumenti esterni. In precedenza, le definizioni di tutti gli strumenti disponibili venivano incluse nel prompt iniziale, consumando un numero elevato di token al crescere dell’ecosistema di connettori. Con GPT-5.4, il modello riceve un elenco leggero e recupera dinamicamente la definizione dello strumento soltanto quando necessario — un approccio che riduce i costi per richiesta e migliora la velocità nelle architetture con molti tool.

Il contesto: OpenAI sotto pressione

Il lancio di GPT-5.4 arriva in un momento di forte pressione competitiva e reputazionale per OpenAI. Dopo che la decisione di collaborare con il Pentagono ha generato un’ondata di critiche pubbliche, defezioni di utenti e proteste interne da parte di alcuni dipendenti, l’azienda ha bisogno di riportare l’attenzione sul piano dei risultati tecnologici.

Sul fronte della concorrenza, il ritmo di rilascio dei modelli si è accelerato in modo significativo: dalla pubblicazione di GPT-5 in agosto 2025, OpenAI ha mantenuto un cadenza di aggiornamenti senza precedenti — GPT-5.1 a novembre, GPT-5.2 a dicembre, le varianti GPT-5.3 (Codex e Instant) a febbraio e marzo 2026. Con GPT-5.4, l’intervallo tra versioni si è ridotto a circa un mese.

Chi beneficia davvero di GPT-5.4?

GPT-5.4 è costruito per professionisti, sviluppatori e aziende che lavorano con attività complesse e strutturate. È il modello giusto per chi ha bisogno di:

Automatizzare workflow professionali su più applicazioni software
Sviluppare agenti AI capaci di operare in ambienti digitali reali
Gestire documenti lunghi e analisi complesse grazie alla context window da 1 milione di token
Ridurre gli errori fattuali in contesti sensibili come analisi finanziarie, legali o mediche

Per l’utente medio di ChatGPT, i miglioramenti nella qualità delle risposte e nella riduzione delle allucinazioni saranno tangibili nell’uso quotidiano. Per sviluppatori e aziende enterprise, le novità legate al computer use e al tool search aprono scenari di automazione precedentemente non accessibili con un modello general-purpose.

Un passo avanti concreto, ma la strada è ancora lunga

GPT-5.4 è un rilascio sostanziale, non un semplice ritocco. La combinazione di computer use nativo, context window estesa, benchmark professionale in crescita e riduzione delle allucinazioni lo posiziona come uno degli aggiornamenti più significativi della serie GPT-5. Rimane da vedere quanto questi progressi tecnici riusciranno a compensare le criticità di immagine che OpenAI si trova ad affrontare — ma sul piano del prodotto, l’azienda ha consegnato qualcosa di concreto.