Profilazione pubblicitaria e tutela della privacy: la soluzione del Federated Learning

persone preoccupate che la pubblicità online non sia rispettosa della privacy dei dati

La profilazione della pubblicità online si è basata finora su un principio semplice ma invasivo: raccogliere i dati personali degli utenti, centralizzarli su server remoti e analizzarli tramite modelli di machine learning per prevedere comportamenti, interessi e intenzioni di acquisto. Questo approccio ha alimentato la crescita di colossi dell’Ad-Tech, ma ha anche generato una crisi di fiducia, un’escalation normativa e un crescente allarme da parte degli utenti.

Le normative (GDPR in Europa, CCPA negli Stati Uniti, e iniziative simili in Asia e America Latina), la discussione sull’eliminazione dei cookies di terze parti, le limitazioni imposte dai sistemi operativi mobile (come iOS con App Tracking Transparency) e la maggiore consapevolezza degli utenti stanno obbligando il settore a ripensare radicalmente il modo in cui vengono processati i dati.

In questo contesto il Federated Learning (FL) appare una delle soluzioni tecnologiche più promettenti. Non si tratta semplicemente di una nuova tecnica di machine learning, ma di un cambio di paradigma: invece di portare i dati ai modelli, si portano i modelli ai dati. Questo capovolgimento ha implicazioni profonde per la privacy, la sicurezza, la governance dei dati e l’efficacia delle campagne pubblicitarie.

Il Federated Learning è una tecnica di apprendimento automatico distribuito in cui il modello viene addestrato su più dispositivi o nodi decentralizzati senza che i dati grezzi vengano mai trasferiti o centralizzati. Ogni dispositivo elabora localmente i propri dati e invia al server centrale solo elaborazioni aggiornate del modello (come gradienti o pesi), che vengono aggregate per migliorare il modello globale

Il modello di profilazione classico

Per comprendere meglio il cambiamento generato dal Federated Learning è opportuno riepilogare i capisaldi del processo di profilazione classico:

  1. Raccolta dei dati dagli utenti (click, visualizzazioni, cronologia, preferenze, etc…).
  2. Trasferimento dei dati verso server centrali.
  3. Archiviazione e normalizzazione dei dati.
  4. Addestramento di modelli di machine learning centralizzati.
  5. Distribuzione delle previsioni (annunci personalizzati)

Questo approccio ha generato molti problemi:

  • Rischi per la privacy.
  • Superficie di attacco ampia in caso di violazioni dei dati.
  • Costi infrastrutturali elevati.
  • Difficoltà di compliance normativa.
  • Dipendenza da consensi espliciti (sempre più spesso negati dagli utenti).

Il paradigma del Federated Learning

Il Federated Learning ribalta lo schema classico:

  1. Il modello iniziale viene inviato ai dispositivi o ai nodi locali.
  2. Ogni nodo addestra il modello sui dati residenti in locale.
  3. Solo gli aggiornamenti del modello (non i dati) vengono inviati al server centrale.
  4. Il server aggrega gli aggiornamenti (federated averaging).
  5. Il modello aggiornato viene redistribuito.

I benefici principali di questo approccio sono:

  • Data transfer minimization: i dati restano dove sono stati generati.
  • Privacy by design: la privacy è integrata nell’architettura e presenta una maggiore resilienza ai cambiamenti normativi.
  • Decentralizzazione: riduzione della dipendenza dai grandi data lake e conseguente riduzione del rischio in caso di data breach
  • Collaborazione: più attori contribuiscono a sviluppare un modello comune senza condividere dati sensibili.

Il Federated Learning, invece di investire risorse per centralizzarla, sfrutta la distribuzione naturale dei dati utili alla profilazione (sugli smartphone e i browser degli utenti, presso editori e piattaforme, nei CRM degli inserzionisti, etc…).

Applicazioni

L’esempio piu noto di applicazione del Federate Learning all’advertising è rappresentato dal progetto Federated Learning of Cohorts (FLoC) di Google: quest’approccio, sperimentato come alternativa ai cookie di terze parti, raggruppa gli utenti in “coorti” basate su interessi simili. Il modello viene addestrato il modello direttamente nel browser senza inviare dati a un server centrale, permettendo così di mantenere un buon livello di targeting pur tutelando la privacy individuale. I test indicano che FLoC può raggiungere tassi di conversione comparabili agli attuali metodi di profilazione centralizzata, dimostrando la praticabilità di soluzioni pubblicitarie rispettose dei dati personali.

Anche la ricerca accademica sta producendo applicazioni che mostrano come il Federated Learning possa migliorare i modelli di profilazione pubblicitaria più tradizionali. Lo studio FedCTR propone un sistema federato per la previsione del click‑through rate (CTR) su annunci nativi elaborando i comportamenti multi‑piattaforma degli utenti in modo privacy‑preserving. Il modello aggrega solo rappresentazioni dei profili senza centralizzare i dati grezzi.

Un progetto molto interessante è anche l’applicazione dell’apprendimento federato allo smart advertising su piattaforme social come AROUND, dove un’architettura basata sul Federate Learning ha migliorato la precisione delle raccomandazioni pubblicitarie e l’engagement degli utenti rispetto a tecniche centralizzate, riducendo anche l’abbandono da parte degli utilizzatori preoccupati per la privacy.

Infine, grandi aziende come Apple hanno già implementato il Federated Learning per personalizzare raccomandazioni (ad esempio nell’App Store) mantenendo i dati degli utenti sui dispositivi e migliorando le analisi di marketing senza comprometterne la riservatezza.

Conclusione

I dati utilizzati per la profilazione pubblicitaria sono estremamente sensibili: (interessi personali, comportamenti di navigazione, pattern di consumo, etc…). Ridurre il trasferimento di questi dati è cruciale per riconquistare la fiducia degli utenti. Per quanto restino ancora alcuni importanti elementi architetturali da perfezionare (eterogeneità dei dati locali, instabilità di connessione tra il modello centrale e i dispositivi individuali, complessità nel debugging) il Federated Learning è sicuramente una delle strade più concrete, tecnicamente solide e normativamente compatibili per provare a conciliare due obiettivi percepiti come antitetici: profilazione pubblicitaria e protezione dei dati personali.

Bibliografia

In questo breve post non mi sono soffermato sugli aspetti tecnici. A chi volesse approfondirli, consiglio le seguenti letture:

SARC Publisher. (2025). Privacy-preserving ad targeting: Leveraging federated learning and clean room solutions.

García, M. (2025). A federated learning approach to smart advertising [Tesi universitaria]. TESISenRed.

Lee, H., & Park, J. (2025). Federated learning’s role in next-gen TV ad optimization. Journal of Media Analytics, 18(2), 45–62.

Zhang, L., Chen, Y., & Kumar, S. (2025). Blockchain-integrated AI framework for secure IoT-based digital advertising ecosystems. Springer.

Tabor, F. (2025). The role of federated learning in entertainment and media: Enhancing content personalization and ad targeting with privacy-preserving AI. Francesca Tabor.

Stratistics Market Research. (2025). Federated learning and privacy-preserving AI market forecasts to 2032. MarketResearch.com.

Pubblicato da

Alfredo Iannone

Mi occupo appassionatamente di interazione digitale con particolare riferimento ai modelli di advertising, alla UX mobile e alle tecnologie pervasive. Sono direttore di Veesible, la concessionaria pubblicitaria del gruppo Tessellis. Sono stato Digital Media Director presso Tiscali spa e responsabile di Tiscali.it, uno dei maggiori siti web italiani. Ho collaborato con Yahoo!, MSN, RAI, CNR e ho coordinato il Master in New Media presso lo IED

Lascia un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *