L'IA riesce a ricavare dati personali dalle pubblicità che visualizziamo

Ricercatori di UNSW Sydney e QUT hanno dimostrato che i modelli linguistici possono inferire età, genere, orientamento politico e situazione economica analizzando esclusivamente gli annunci pubblicitari ricevuti da un utente.
Il vettore di attacco più probabile sono le estensioni browser, che dispongono già dei permessi necessari per leggere il contenuto delle pagine web.
Una VPN non offre alcuna protezione: gli annunci arrivano sul dispositivo indipendentemente dalla connessione utilizzata.

Le piattaforme pubblicitarie costruiscono profili sugli utenti e selezionano quali annunci mostrare in base a quei profili. Questo processo genera un flusso di inserzioni unico per ogni persona, un pattern che riflette caratteristiche private senza che l’utente ne sia consapevole. Un team di ricercatori della UNSW Sydney e della Queensland University of Technology (QUT) ha ora dimostrato che questo pattern è sufficiente per ricostruire un profilo personale dettagliato, ricavando così i nostri dati personali dalle pubblicità senza accedere alla cronologia di navigazione né ad alcun dato anagrafico.

Lo studio ha analizzato oltre 435.000 inserzioni Facebook raccolte da 891 utenti australiani nell’ambito di un progetto di citizen science. Utilizzando modelli linguistici di grandi dimensioni ampiamente disponibili, i ricercatori hanno verificato che l’IA profila utenti dagli annunci pubblicitari con un livello di accuratezza significativo su variabili come genere, età, istruzione, occupazione, orientamento politico e condizione economica.

Velocità e costo dell’inferenza da LLM

Il dato più rilevante non riguarda solo la fattibilità tecnica, ma la sua accessibilità pratica. Rispetto all’analisi manuale degli stessi pattern pubblicitari, i modelli linguistici si sono dimostrati oltre 200 volte più economici e 50 volte più veloci. Anche sessioni di navigazione brevi hanno fornito all’IA dati sufficienti per costruire un profilo accurato: non sono necessarie settimane di osservazione.

Questo riduce drasticamente la soglia di ingresso per potenziali attori malevoli. Non serve una struttura sofisticata né l’accesso diretto ai sistemi delle piattaforme. L’inferenza dati personali pubblicità online è ora un’operazione alla portata di chiunque disponga di strumenti comunemente accessibili.

Le vulnerabilità nascoste nelle estensioni del browser

Il canale di esfiltrazione più probabile individuato dai ricercatori coincide con i software che milioni di persone installano regolarmente sui propri dispositivi. Le estensioni del browser, come i filtri per i banner o i traduttori di pagina, ottengono autorizzazioni native per leggere il codice sorgente dei domini visitati. Questa concessione tecnica si presta a un abuso tanto invisibile quanto rapido.

Gli sviluppatori di questi piccoli applicativi necessitano dell’accesso diretto al documento web per poter nascondere o modificare i riquadri promozionali. Di fatto, chi controlla lo strumento dispone delle chiavi per registrare passivamente ogni elemento iniettato sullo schermo. Il componente compromesso invia i dati a un server esterno mantenendo inalterata la promessa funzionale originale. La concessionaria pubblicitaria non percepisce intrusioni, poiché l’emorragia avviene sul monitor del destinatario finale. Tale opacità alimenta una sorveglianza digitale complessa da arginare.

Perché è difficile impedire l’estrazione dei dati personali dalle pubblicità visualizzate

Il paper chiarisce l’assoluta inefficacia delle connessioni protette contro questo specifico tracciamento. Le reti private virtuali oscurano l’indirizzo IP e mascherano la provenienza geografica, ma non interrompono la consegna delle campagne promozionali. I giganti del web continuano a servire messaggi commerciali basati sullo storico delle interazioni. Mascherare il nodo di rete non frena l’accumulo del pattern visivo e non protegge l’identità comportamentale.

Modificare i parametri interni nei pannelli di controllo dei social network mitiga l’esposizione superficiale. Disconnettersi integralmente dal circuito di profilazione implica tuttavia l’abbandono di ecosistemi digitali primari. I singoli iscritti si trovano sprovvisti di vere opzioni di opt-out.

Le scoperte dell’ateneo australiano impongono un forte ridimensionamento delle tutele giuridiche attuali. Le vigenti normative sulla privacy presidiano le procedure di raccolta diretta, sanzionando gli abusi sui campi compilati deliberatamente dagli utenti. Il dettato di legge fatica a inquadrare l’estrazione di metriche sensibili generate per pura via deduttiva.

Constatare che l’IA può ricavare dati personali dalle pubblicità che gli utenti visualizzano richiede un rapido aggiornamento della giurisprudenza continentale. Il regolatore europeo dovrà assimilare il concetto di deduzione passiva, estendendo i vincoli del GDPR alle stime comportamentali prodotte dai software generativi. Ignorare questo scatto evolutivo renderebbe le normative sulla privacy inadeguate di fronte a un mercato sempre più abile nello sfruttare i contenuti visualizzati.

Fonte

The Clipboard

The Clipboard è una pubblicazione tech italiana indipendente fondata da Enrico Andreoli e Niccolò Proietti Savina, due blogger che vivono il settore tech da oltre 15 anni. Copriamo intelligenza artificiale, hardware, economia della tecnologia, privacy digitale e cultura internet con un approccio editoriale che privilegia l’analisi e la spiegazione piuttosto che la notizia fine a sé stessa.

L’IA riesce a ricavare dati personali dalle pubblicità che visualizziamo

Velocità e costo dell’inferenza da LLM

Le vulnerabilità nascoste nelle estensioni del browser

Perché è difficile impedire l’estrazione dei dati personali dalle pubblicità visualizzate

WikiLeaks compie 20 anni: la storia della piattaforma che ha fatto tremare i governi

Come funzionano davvero i marketplace del dark web e perchè finiscono sempre allo stesso modo

Perché la corsa all’intelligenza artificiale sta rendendo impossibili i piani climatici di Google e Amazon

Nuovi dazi sui pacchi dalla Cina (Luglio 2026): perché i 3€ in più non aiuteranno i lavoratori

La crisi della memoria DRAM che sta facendo aumentare il prezzo di tutto