Costi AI fuori controllo: Microsoft e Uber frenano

Microsoft e Uber stanno ridimensionando l'uso dell'AI dopo che i costi in token hanno superato i benefici concreti misurabili in termini di funzionalità per gli utenti.
Goldman Sachs scommette su chip più efficienti per abbassare i costi, ma i tempi di adozione dell'hardware non coincidono con l'urgenza economica del presente.

Il conto dell’intelligenza artificiale inizia ad arrivare, e per alcune grandi aziende è più salato del previsto. Microsoft e Uber sono tra le prime a dover ripensare le proprie strategie dopo che i costi AI hanno iniziato a crescere in modo difficile da giustificare. Il problema non è l’AI in sé, ma la modalità con cui viene usata: in particolare la proliferazione degli agenti AI, che secondo un recente rapporto di Goldman Sachs possono consumare fino a 24 volte più token rispetto a un semplice chatbot, e in certi scenari anche oltre 1.000 volte tanto.

Uber e Microsoft alle prese con i costi AI

La vicenda di Uber ha fatto rumore nelle settimane scorse, quando il CTO Praveen Neppalli Naga ha rivelato pubblicamente che la società aveva bruciato l’intero budget AI per il 2026 nel giro di pochi mesi. A fare eco alle sue parole è stato Andrew Macdonald, responsabile delle Operations di Uber, che ha ammesso in un’intervista a Business Insider come non esista una correlazione chiara tra la spesa in token e il valore reale prodotto per gli utenti. Più codice viene generato, questo è certo, ma tracciare una linea diretta tra quella produzione e un miglioramento concreto del prodotto è, nelle sue parole, “molto difficile”.

La situazione non è molto diversa in casa Microsoft. Dopo aver aperto ai propri dipendenti l’accesso agli abbonamenti Claude Code a dicembre 2025, l’azienda ha deciso di fare marcia indietro, una mossa letta da molti come una risposta ai costi crescenti più che una scelta puramente strategica. Parallelamente, Microsoft Copilot su GitHub è passato a un modello di fatturazione basato sui token, dopo che i costi di gestione dello strumento erano lievitati in modo significativo all’inizio dell’anno.

Non è una storia isolata. Airbnb ha comunicato agli investitori che il 60% del suo codice è ora generato dall’AI e anche Google sostiene che metà del proprio codice viene prodotto da sistemi automatizzati, pur specificando che viene sempre revisionato da un ingegnere umano. Uber, con oltre l’80% dei suoi sviluppatori che usano agenti AI e più del 60% di codice AI-generato, rientra in questo quadro. Ma per Uber, stando alle dichiarazioni del management, il gioco non vale la candela.

Il paradosso dei token: più spendi, non è detto che guadagni

Il CEO di Nvidia Jensen Huang ha affermato a marzo che si aspetterebbe che ogni ingegnere con uno stipendio da 500.000 dollari utilizzi almeno 250.000 dollari di token all’anno. È una dichiarazione che fotografa bene la mentalità dominante nel settore: il volume di utilizzo dell’AI viene trattato come un segnale di efficienza e innovazione. Ma i dati reali raccontano un’altra storia.

Peter Steinberger, creatore di OpenClaw e ora dipendente OpenAI, ha reso noto che il suo team di tre persone ha speso oltre 1,3 milioni di dollari in token in un solo mese utilizzando una suite di strumenti agentic AI. Un dato che dimostra come, senza controlli adeguati, i costi possano sfuggire rapidamente a qualsiasi piano di budget.

Questo solleva una domanda scomoda per molte aziende: se l’AI dovrebbe aumentare la produttività riducendo la necessità di personale, come si giustificano spese che in alcuni casi superano già il costo dei lavoratori che dovrebbe sostituire? La diffusione degli agenti AI è la principale causa di questa spirale. A differenza di un chatbot tradizionale, un agente AI esegue sequenze articolate di operazioni, ciascuna delle quali consuma token. Il risultato è un moltiplicatore di spesa che può rendere economicamente insostenibile un’adozione massiva a breve termine.

Vale la pena ricordare che il tema della sostenibilità economica dell’AI è già emerso in contesti diversi. Abbiamo già analizzato come Uber stia mettendo in discussione i propri investimenti AI e cosa significhi non riuscire a giustificare i token spesi, oppure come in realtà come Amazon i dipendenti stiano ricorrendo sempre di più al tokenmaxxing per andare incontro alle richieste dell’azienda in merito all’adozione dell’AI nel proprio lavoro, un segnale che la questione non riguarda solo le cifre ma il modo stesso in cui le aziende misurano il ritorno dell’AI.

Il ruolo dei chip e l’orizzonte temporale del problema

L’industria AI punta su hardware più efficiente per uscire dall’impasse. Nvidia presenterà la piattaforma Vera Rubin a Computex con un lancio ufficiale previsto per la fine del 2026. Le promesse sono ambiziose: prestazioni più elevate e fino a 10 volte l’efficienza energetica per watt rispetto alle generazioni precedenti. Un balzo di questa portata renderebbe il costo per token significativamente inferiore, riportando in equilibrio i conti delle aziende che usano AI in modo intensivo.

Il problema è il tempo. Più del 50% dei progetti di data center pensati per l’hardware Blackwell è stato cancellato o rimandato. E Google, Oracle e Microsoft hanno già dichiarato a fine 2025 di voler prolungare il ciclo di vita delle proprie GPU fino a sei anni, un piano difficile da conciliare con la velocità con cui evolve sia la domanda di potenza computazionale sia l’architettura degli agenti AI.

Il rapporto di Goldman Sachs mantiene una posizione ottimista: i guadagni di efficienza derivanti dai chip di nuova generazione per l’inferenza renderanno l’AI così conveniente da far ripartire gli investimenti. Ma questo scenario presuppone che le aziende reggano finanziariamente l’attesa, e che la domanda di agenti AI rimanga stabile anche mentre i costi continuano a pesare sui bilanci. Se invece la spesa porta le aziende a ridurre l’utilizzo, le stesse società AI rischiano di non trovare nell’immediato la redditività necessaria per ammortizzare le infrastrutture che stanno ancora costruendo.

La reale incognita non è tecnica, ma economica: chi riesce ad aspettare l’hardware più efficiente senza compromettere la propria posizione competitiva, e chi nel frattempo è costretto a riscrivere le proprie ambizioni AI al ribasso.

The Clipboard

The Clipboard è una pubblicazione tech italiana indipendente fondata da Enrico Andreoli e Niccolò Proietti Savina, due blogger che vivono il settore tech da oltre 15 anni. Copriamo intelligenza artificiale, hardware, economia della tecnologia, privacy digitale e cultura internet con un approccio editoriale che privilegia l’analisi e la spiegazione piuttosto che la notizia fine a sé stessa.

Costi AI fuori controllo: perché Microsoft e Uber frenano sugli agenti

Uber e Microsoft alle prese con i costi AI

Il paradosso dei token: più spendi, non è detto che guadagni

Il ruolo dei chip e l’orizzonte temporale del problema

ASUS ROG Strix Aiolos: specifiche e prezzo del nuovo case per SSD M.2

Zero-day su WordPress: come un’intelligenza artificiale ha creato un exploit RCE in 10 ore spendendo solo 25$

HONOR Pad X9 Max: il nuovo tablet da 13 pollici che unisce multimedialità e produttività leggera

Anche Google alza i prezzi: Pixel 11 costerà 100 dollari in più

Il J-space di Claude: Anthropic svela come ragiona l’AI