Come possiamo generare un nuovo concetto mai visto prima? I ricercatori dell’Università di Tel Aviv propongono ConceptLab Generazione creativa utilizzando vincoli di diffusione precedenti.

I ricercatori dell'Università di Tel Aviv propongono ConceptLab Generazione creativa utilizzando vincoli di diffusione precedenti.

Recenti sviluppi nel campo dell’Intelligenza Artificiale hanno portato a soluzioni per una varietà di casi d’uso. Diversi modelli generativi di testo-immagine hanno aperto la strada a un nuovo campo entusiasmante in cui le parole scritte possono essere trasformate in rappresentazioni visuali vibranti e coinvolgenti. La capacità di concepire idee distinte in nuove circostanze è stata ulteriormente ampliata dall’esplosione delle tecniche di personalizzazione come una logica evoluzione. Sono stati sviluppati numerosi algoritmi che simulano comportamenti creativi o mirano a migliorare e potenziare i processi creativi umani.

I ricercatori si sono impegnati per scoprire come utilizzare queste tecnologie per creare concetti completamente originali e inventivi. A tal proposito, in un recente articolo di ricerca, un team di ricercatori ha introdotto Concept Lab nel campo della generazione inventiva di testo-immagine. L’obiettivo principale in questo ambito è fornire nuovi esempi che rientrino in una vasta categorizzazione. Considerando la sfida di sviluppare una nuova razza di animale domestico radicalmente diversa da tutte le razze a cui siamo abituati, il dominio dei modelli di Diffusion Prior è lo strumento principale in questa ricerca.

Questo approccio ha tratto ispirazione dalla personalizzazione basata su token, che è l’encoder di testo di un modello generativo pre-addestrato che utilizza un token per esprimere un concetto unico. Poiché non esistono fotografie precedenti dell’oggetto previsto, creare un nuovo concetto è più difficile che utilizzare una tecnica di inversione convenzionale. Il modello visione-linguaggio CLIP è stato utilizzato per guidare il processo di ottimizzazione al fine di affrontare questo problema. Ci sono aspetti positivi e negativi delle limitazioni; mentre le limitazioni negative coprono i membri esistenti della categoria da cui la generazione dovrebbe deviare, il vincolo positivo promuove lo sviluppo di immagini che sono in linea con la vasta categoria.

Gli autori hanno dimostrato come la difficoltà di creare contenuti veramente originali possa essere efficacemente articolata come un processo di ottimizzazione che avviene nello spazio di output della diffusione precedente. Il processo di ottimizzazione porta a ciò che essi definiscono come vincoli precedenti. I ricercatori hanno incorporato un modello di domanda-risposta nel framework per garantire che i concetti generati non convergano semplicemente verso i membri esistenti della categoria. Questo modello adattivo è fondamentale per il processo di ottimizzazione mediante l’aggiunta ripetuta di nuovi vincoli.

Questi vincoli aggiuntivi hanno guidato il processo di ottimizzazione, incoraggiandolo a trovare invenzioni sempre più uniche e distinte. Il modello esplora gradualmente aree sconosciute dell’immaginazione grazie alla natura adattiva di questo sistema, che incoraggia il modello a spingere i propri limiti creativi. Gli autori hanno anche sottolineato l’adattabilità dei vincoli precedenti suggeriti. Agiscono come un potente meccanismo di miscelazione oltre a facilitare la creazione di concetti originali e solitari. La capacità di mescolare concetti consente la creazione di ibridi, che sono fusioni creative dei concetti generati. Questo ulteriore grado di adattabilità migliora il processo creativo e produce risultati ancora più interessanti e variati.

In conclusione, l’obiettivo principale di questo studio è sviluppare concetti unici e creativi combinando modelli generativi contemporanei di testo-immagine, modelli di Diffusion Prior poco studiati e un meccanismo di espansione dei vincoli adattivi alimentato da un modello di domanda-risposta. Il risultato è una strategia completa che produce contenuti originali e accattivanti e favorisce una fluida esplorazione dello spazio creativo.