Regole dell’AI Act e dati sintetici: coniugare privacy e innovazione

scritto da il 09 Agosto 2023

Post di Daniele Panfilo, CEO di Aindo. startup italiana della Scuola Internazionale Superiore di Studi Avanzati (SISSA) di Trieste che ha sviluppato una piattaforma di Intelligenza Artificiale per la valorizzazione dei dati basata sulla generazione di dati sintetici –

La normativa dell’AI Act europeo è entrata nella fase finale di discussione e negoziazione: lo scorso 14 giugno 2023 il Parlamento Europeo ha approvato la sua versione emendata della proposta di regolamento che stabilisce regole armonizzate sull’Intelligenza Artificiale (AI). Alcuni tra i punti salienti dei negoziati sono ora la definizione dei sistemi di AI, gli obblighi per la General purpose AI e i modelli di Intelligenza Artificiale generativa: l’obiettivo è rafforzare la tutela dei diritti dei cittadini senza limitare lo sviluppo dell’Intelligenza Artificiale, consentendo alle aziende tech di continuare a fare innovazione in tutti i settori che possono trarne beneficio.

All’interno di questo dibattito, i dati sintetici rappresentano una soluzione efficace in grado di coniugare privacy e sviluppo: in particolare, nel training dei sistemi di AI, i dati sintetici sono destinati a ricoprire un ruolo cruciale. Infatti, l’utilizzo dei dati sintetici non solo rafforza le tutele per la privacy degli individui, ma consente in modo sicuro lo sviluppo di sistemi di AI. La generazione di dati sintetici rappresenta, dunque, uno strumento prezioso per le aziende che sviluppano soluzioni di Intelligenza Artificiale, promuovendo l’innovazione in conformità con l’AI Act attraverso un obiettivo primario: favorire il progresso etico dell’Intelligenza Artificiale, agevolando la libertà di ricerca e lo sviluppo di soluzioni avanzate.

Verso l’AI Act: i negoziati e le preoccupazioni delle aziende tech

L’AI Act suddivide le applicazioni dell’Intelligenza Artificiale in tre categorie di rischio e si propone di agire vietando quelle che rappresentano un pericolo inaccettabile (sistemi utilizzati in modo invasivo e discriminatorio, con rischi per i diritti fondamentali dei cittadini), limitando quelle che presentano un alto rischio (per esempio se utilizzate nelle infrastrutture critiche, come reti elettriche e ospedali, o quando supportano decisioni sulla vita dei cittadini) e imponendo obblighi di trasparenza a quelle che presentano un basso rischio, come le app per la traduzione o il riconoscimento delle immagini.

Sulla base della più recente proposta approvata, la discussione interna alle istituzioni europee si focalizza ora su alcuni punti (attualmente ancora in dibattito nel cosiddetto “trilogo”, ovvero la negoziazione tra Commissione Europea, Consiglio e Parlamento), quali la definizione dei sistemi di intelligenza Artificiale, l’ampliamento dell’elenco dei sistemi di AI vietati, gli obblighi per la cosiddetta General purpose AI (i sistemi di Intelligenza Artificiale con un’ampia gamma di usi possibili) e i modelli di IA generativa, come Chat GPT.

AI Act, regolamentazione troppo costosa per le aziende?

Dal punto di vista delle aziende tech l’introduzione dell’AI Act è una regolamentazione necessaria, che consente di continuare a fare innovazione nel rispetto dei diritti e tutelando la libertà degli utenti. Alcune delle obiezioni avanzate, però, sostengono che la regolamentazione sia troppo rigorosa e chieda alle imprese di conformarsi a standard elevati per garantire la sicurezza, trasparenza e responsabilità dei sistemi AI con un conseguente impegno finanziario e di risorse. L’AI Act potrebbe inoltre richiedere alle aziende di apportare modifiche significative alle operazioni esistenti per garantire la conformità alle nuove regole, affrontando complesse procedure di valutazione del rischio, revisione dei processi interni, formazione del personale. Le sanzioni per chi viola le regole, infine, sono elevate e includono multe fino al 6% del fatturato annuo globale dell’azienda.

I dati sintetici come possibile soluzione. Che cosa sono?

L’introduzione dell’AI Act rappresenterà quindi un impegno per le aziende che intendono sfruttare a pieno le potenzialità dell’Intelligenza Artificiale in ambiti ad alto impatto sociale e di business e, al tempo stesso, garantire l’aderenza alle regole. Queste nuove sfide, di conseguenza, rischiano di frenare o interrompere l’innovazione tecnologica. Per coniugare ad esempio privacy e innovazione, una soluzione già sul mercato sono i dati sintetici: si tratta di dati artificiali che non sono raccolti attraverso tradizionali metodi empirici ma vengono generati algoritmicamente e costruiti attraverso tecniche di Intelligenza Artificiale generativa.

dati sintetici

(sdecoret – stock.adobe.com)

In quanto tali, non sono legati a nessun individuo ma, grazie a tecniche di machine learning, mantengono le stesse proprietà statistiche dei dati originali. La tecnologia dei dati sintetici si sta imponendo come elemento chiave per implementare con successo progetti di Intelligenza Artificiale e data analytics: consentono infatti alle organizzazioni di valorizzare i propri dati e, in particolare, di scambiarli e analizzarli in modo sicuro, sopperendo alle carenze nei database e fornendo informazioni complete e rappresentative.

Perché l’AI Act menziona i dati sintetici

L’AI Act menziona in diversi punti i dati sintetici: in particolare, li cita come uno strumento che permette un training sicuro ed etico dei modelli di AI. Basti pensare che Gartner, società internazionale di consulenza in ambito tech, prevede che entro il 2030 la maggior parte dei sistemi di Intelligenza Artificiale sarà addestrata proprio su dati sintetici.

Dati sintetici per il settore sanitario: più privacy al servizio dell’innovazione

Nei prossimi anni l’utilizzo dei dati sintetici potrebbe contribuire a innovare in maniera rilevante il settore sanitario: l’impiego di dati sintetici, infatti, può aiutare a preservare la privacy dei pazienti, in quanto si tratta di dati creati artificialmente e quindi privi di informazioni sensibili. Ciò consente ai ricercatori e agli altri professionisti nell’ambito sanitario di lavorare con dati “fittizi” che conservino le caratteristiche essenziali dei dati originali.

Pensiamo per esempio allo sviluppo di un modello capace di predire il rischio di un cancro a partire da determinati fattori di rischio e informazioni mediche dei pazienti: al posto di queste informazioni sensibili, possono invece essere impiegati i dati sintetici, che sono in grado di contribuire allo sviluppo del modello predittivo.

L’utilizzo dei dati sintetici permette anche di aumentare i dataset e di bilanciarli, sopperendo a carenze o a dati incompleti o inaccurati, consentendo così analisi adeguate e più efficaci. Si pensi al caso delle malattie rare, che presentano tipicamente dati scarsi: non avendo informazioni a sufficienza da cui attingere, l’algoritmo di identificazione precoce della patologia non è in grado di raggiungere le performance. Con la generazione di dati sintetici si possono inoltre ripopolare o ribilanciare le classi poco rappresentate.

Con i dati sintetici innovazione e rispetto delle regole europee

La tecnologia di generazione dei dati sintetici rappresenta dunque uno strumento prezioso per i soggetti che sviluppano e commercializzano soluzioni di AI, permettendo di fare innovazione e di essere compliant agli obblighi imposti dall’AI Act. Molte aziende hanno riconosciuto il potenziale di questa tecnologia e la stanno già impiegando per lo sviluppo di progetti innovativi, in particolare nel settore della salute, dove può avere grande impatto.

Un esempio di applicazione dei dati sintetici nel settore sanitario viene dai Paesi Bassi: l’IKNL (Integraal Kankercentrum Nederland, istituto olandese per la ricerca sul cancro) ha messo a disposizione di ospedali, industria e ricercatori un dataset sintetico che riproduce parte del registro tumori olandese (Netherlands Cancer Registry). Questo dataset non contiene informazioni reali bensì dati sintetici generati a partire da quelli originali dei pazienti. Il dataset sintetico generato è stato condiviso liberamente con aziende esterne e ricercatori affinchè questi possano sviluppare, a partire da esso, sistemi di AI per finalità quali l’individuazione precoce di malattie e il supporto alla diagnostica: gli algoritmi così sviluppati su dati sintetici potranno essere utilizzati per la diagnostica precoce garantendo allo stesso tempo la privacy dei pazienti.

Perché il progresso proceda su binari etici chiari

I sistemi di AI possono apportare immensi benefici, soprattutto in settori ad alto impatto sulla società come la salute. In un ambiente democratico e attento ai diritti come è l’Unione Europea, è cruciale che venga implementata una regolamentazione in grado di creare un framework sicuro per lo sviluppo e l’adozione dei sistemi di Intelligenza Artificiale, tutelando le persone e stimolando l’innovazione. Una regolamentazione attenta come l’AI Act non ha come obiettivo rallentare il progresso tecnologico, bensì far procedere il progresso su binari etici ben chiari.