- Uno studio quantifica che il 35,3% dei nuovi siti web è creato con AI, il 17,6% completamente automatico, secondo ricercatori di Imperial College London, Stanford University e Internet Archive.
- I contenuti AI mostrano standardizzazione e tono artificiale, ma non risultano più imprecisi dei testi umani.
- Crescono utilizzi problematici come siti falsi e ingannevoli; i ricercatori sviluppano strumenti di monitoraggio continuo.
Il modo in cui il web si sta trasformando è al centro di un dibattito sempre più intenso. Da quando strumenti come ChatGPT hanno reso accessibile la generazione automatica di contenuti, la presenza dell’intelligenza artificiale nella creazione di pagine online è cresciuta in modo esponenziale. Un recente studio condotto da ricercatori di Imperial College London, Stanford University e Internet Archive ha provato a quantificare questo fenomeno, analizzando milioni di siti web pubblicati negli ultimi anni.
L’indagine si basa sui dati raccolti dalla Wayback Machine, lo storico archivio digitale che permette di esplorare l’evoluzione del web nel tempo. Il periodo preso in esame va dalla fine del 2022, quando è iniziata la corsa all’intelligenza artificiale generativa, fino alla metà del 2025. I risultati mostrano che oltre un terzo dei nuovi siti pubblicati online è stato realizzato con l’assistenza di strumenti di AI, mentre una parte più ristretta è stata generata in modo completamente automatico.
Dati e proporzioni del fenomeno
Secondo lo studio, a maggio 2025 il 35,3% di tutti i nuovi siti web è stato creato con il supporto dell’intelligenza artificiale. Di questi, il 17,6% risulta completamente generato da algoritmi, senza intervento umano significativo nella stesura dei contenuti. Questa percentuale viene letta da alcuni come una conferma parziale della cosiddetta Dead Internet Theory, una teoria secondo cui gran parte dell’attività online sarebbe ormai dominata da bot e contenuti automatizzati.
Le cifre emerse dalla ricerca si allineano con altre analisi pubblicate negli ultimi mesi. Cloudflare aveva riportato a settembre 2025 che quasi un terzo del traffico internet era generato da bot. Qualche giorno dopo, il CEO dell’azienda aveva parlato della possibile concentrazione del controllo della conoscenza online nelle mani di pochi grandi gruppi tecnologici. Un report ancora precedente di Imperva, azienda specializzata in sicurezza informatica, aveva evidenziato che nel 2024 l’attività automatizzata aveva superato per la prima volta quella umana, arrivando a rappresentare circa la metà del traffico complessivo sul web.
Cosa cambia nei contenuti generati da AI
Il team di ricerca ha voluto verificare sei convinzioni comuni tra gli utenti statunitensi riguardo al futuro di un internet dominato da contenuti creati dall’intelligenza artificiale. Due di queste ipotesi hanno trovato conferma nei dati raccolti. La prima riguarda la riduzione della varietà di idee e punti di vista, con una standardizzazione crescente dei contenuti. La seconda riguarda il tono di scrittura, che appare sempre più artificialmente positivo e privo di spontaneità.
Altre previsioni diffuse non hanno invece trovato riscontro. I contenuti generati da AI non risultano particolarmente più imprecisi dal punto di vista fattuale rispetto a quelli scritti da persone. Inoltre, tendono a citare le fonti attraverso link esterni, non eliminano completamente gli stili di scrittura individuali e non sono necessariamente lunghi blocchi di testo privi di informazioni utili, come spesso si ritiene.
Diffusione e utilizzi problematici
Sono numerosi i casi che mostrano come l’intelligenza artificiale venga utilizzata per creare rapidamente siti web falsi o ingannevoli. Truffatori sfruttano questi strumenti per mettere in piedi piattaforme dall’aspetto credibile con l’obiettivo di ingannare le vittime. Altri utilizzano l’AI per copiare contenuti da testate giornalistiche o per generare pagine il cui unico scopo è quello di posizionarsi sui motori di ricerca, senza offrire alcun valore reale.
Un caso recente riguarda un sito legato a un comitato elettorale sostenuto da OpenAI, accusato di aver pubblicato numerosi articoli presumibilmente generati da intelligenza artificiale per attaccare i critici dei prodotti AI. Anche Sam Altman, CEO di OpenAI, ha ammesso lo scorso anno che alcuni elogi eccessivamente entusiasti ricevuti su un forum online dopo il lancio di un nuovo strumento sembravano generati automaticamente.
Come riconoscere un sito scritto dall’AI
La domanda che molti utenti si pongono è pratica: come distinguere un contenuto generato automaticamente da uno scritto da una persona? Alcuni segnali ricorrenti possono aiutare. Il tono eccessivamente positivo e privo di sfumature critiche è uno degli indicatori più affidabili, confermato anche dallo studio. Altri elementi da osservare sono la mancanza di esperienze personali o aneddoti specifici, la struttura rigida dei paragrafi, la tendenza a usare liste dove un testo umano userebbe prosa, e la presenza di affermazioni generiche difficili da attribuire a una fonte precisa.
Strumenti come GPTZero, Originality.ai e il rilevatore integrato di Copilot permettono di analizzare un testo e stimare la probabilità che sia stato generato da AI. Nessuno di questi strumenti è infallibile, ma combinati con una lettura critica offrono un filtro utile.
Prossimi sviluppi e strumenti di monitoraggio
Lo studio rappresenta un primo passo verso una comprensione più approfondita di come l’intelligenza artificiale stia trasformando la struttura del web. I ricercatori hanno dichiarato di essere al lavoro su uno strumento di monitoraggio continuo, che permetterà di seguire l’evoluzione del fenomeno nel tempo. L’obiettivo è capire quali categorie di siti web sono maggiormente interessate, quali lingue sono più colpite e dove si concentrano gli impatti più significativi. Questo tipo di analisi potrebbe aiutare gli utenti a distinguere con maggiore precisione le fonti affidabili da quelle generate automaticamente.
Cosa significa per chi scrive online
Per chi produce contenuti professionalmente, l’aumento di siti generati dall’AI crea una pressione competitiva anomala: articoli ottimizzati per i motori di ricerca vengono pubblicati in quantità industriale a costo quasi zero. Google ha dichiarato di penalizzare i contenuti privi di valore reale per l’utente indipendentemente da chi li abbia scritti, ma l’applicazione pratica di questo principio è ancora imperfetta. La risposta più efficace per chi vuole emergere rimane quella di puntare su contenuti verificabili, esperienze dirette e angoli che un algoritmo non può replicare: opinioni fondate, contesto storico, analisi critica.





