I ricercatori dell’UC Santa Cruz propongono un nuovo strumento di test di associazione testo-immagine che quantifica gli stereotipi impliciti tra concetti e valenza e quelli presenti nelle immagini.

I ricercatori dell'UC Santa Cruz propongono uno strumento per testare gli stereotipi impliciti tra testo e immagini.

Un team di ricerca dell’UC Santa Cruz ha introdotto un nuovo strumento chiamato Test di Associazione Testo-Immagine. Questo strumento affronta i pregiudizi involontari nei sistemi di intelligenza artificiale generativi Testo-Immagine (T2I). Questi sistemi sono noti per la loro capacità di creare immagini da descrizioni di testo, ma spesso riproducono pregiudizi sociali nei loro risultati. Guidato da un professore assistente, il team ha sviluppato un metodo quantificabile per misurare questi pregiudizi intricati.

Il Test di Associazione Testo-Immagine offre un approccio strutturato per valutare i pregiudizi su diverse dimensioni, come genere, razza, carriera e religione. Questo innovativo strumento è stato presentato alla conferenza 2023 dell’Associazione per la Linguistica Computazionale (ACL). Il suo scopo principale è quantificare e identificare i pregiudizi all’interno dei modelli generativi avanzati, come Stable Diffusion, che possono amplificare i pregiudizi esistenti nelle immagini generate.

Il processo prevede di fornire un prompt neutro, come “bambino che studia scienza”, al modello. Successivamente, vengono utilizzati prompt specifici per genere come “ragazza che studia scienza” e “ragazzo che studia scienza”. Analizzando le differenze tra le immagini generate dai prompt neutri e quelli specifici per genere, lo strumento quantifica il pregiudizio nelle risposte del modello.

Lo studio ha rivelato che il modello di Stable Diffusion presentava pregiudizi allineati a stereotipi comuni. Lo strumento ha valutato le connessioni tra concetti come scienza e arte e attributi come maschio e femmina, assegnando punteggi per indicare la forza di queste connessioni. Curiosamente, il modello ha associato sorprendentemente la pelle scura con la piacevolezza e la pelle chiara con la sgradevolezza, contrariamente alle assunzioni tipiche.

Inoltre, il modello ha mostrato associazioni tra attributi come scienza e maschi, arte e femmine, carriere e maschi, e famiglia e femmine. I ricercatori hanno sottolineato che il loro strumento tiene conto anche degli elementi contestuali nelle immagini, compresi i colori e il calore, distinguendolo dai metodi di valutazione precedenti.

Ispirato al Test di Associazione Implicita in psicologia sociale, lo strumento del team UCSC rappresenta un progresso nella quantificazione dei pregiudizi nei modelli T2I durante le fasi di sviluppo. I ricercatori prevedono che questo approccio fornirà agli ingegneri del software misurazioni più precise dei pregiudizi nei loro modelli, aiutando a identificare e correggere i pregiudizi nei contenuti generati dall’intelligenza artificiale. Con una metrica quantitativa, lo strumento facilita gli sforzi continui per mitigare i pregiudizi e monitorare i progressi nel tempo.

I ricercatori hanno ricevuto feedback incoraggianti e interesse da parte di colleghi studiosi alla conferenza ACL, con molti che hanno espresso entusiasmo per l’eventuale impatto di questo lavoro. Il team ha in programma di proporre strategie per mitigare i pregiudizi durante le fasi di addestramento e perfezionamento del modello. Questo strumento non solo mette in evidenza i pregiudizi insiti nelle immagini generate dall’intelligenza artificiale, ma fornisce anche un modo per correggere e migliorare l’equità complessiva di questi sistemi.