Identificazione delle immagini generate da IA con SynthID

Identificazione immagini IA con SynthID

Nuovo strumento aiuta a inserire un watermark e identificare immagini sintetiche create da Imagen

Le immagini generate dall’IA stanno diventando sempre più popolari ogni giorno. Ma come possiamo identificarle meglio, soprattutto quando sembrano così realistiche?

Oggi, in collaborazione con Google Cloud, stiamo lanciando una versione beta di SynthID, uno strumento per inserire un watermark e identificare le immagini generate dall’IA. Questa tecnologia incorpora un watermark digitale direttamente nei pixel di un’immagine, rendendolo impercettibile all’occhio umano, ma rilevabile per l’identificazione. SynthID viene rilasciato ad un numero limitato di clienti Vertex AI che utilizzano Imagen, uno dei nostri ultimi modelli di testo-immagine che utilizza il testo di input per creare immagini fotorealistiche.

Le tecnologie di intelligenza artificiale generativa stanno evolvendo rapidamente e le immagini generate al computer, anche conosciute come “immagini sintetiche”, stanno diventando sempre più difficili da distinguere da quelle non create da un sistema di intelligenza artificiale.

Anche se l’IA generativa può sbloccare un enorme potenziale creativo, presenta anche nuovi rischi, come consentire ai creatori di diffondere informazioni false, sia intenzionalmente che per errore. Essere in grado di identificare i contenuti generati dall’IA è fondamentale per dotare le persone della conoscenza quando interagiscono con i media generati e per contribuire a prevenire la diffusione di disinformazione.

Siamo impegnati a mettere le persone in contatto con informazioni di alta qualità e a mantenere la fiducia tra creatori e utenti della società. Parte di questa responsabilità consiste nel fornire agli utenti strumenti più avanzati per identificare le immagini generate dall’IA in modo che le loro immagini, e persino alcune versioni modificate, possano essere identificate in seguito.

SynthID genera un watermark digitale impercettibile per le immagini generate dall'IA.

Google Cloud è il primo provider di servizi cloud ad offrire uno strumento per creare immagini generate dall’IA in modo responsabile e identificarle con fiducia. Questa tecnologia si basa sul nostro approccio allo sviluppo e alla distribuzione di un’IA responsabile ed è stata sviluppata da Google DeepMind e perfezionata in collaborazione con Google Research.

SynthID non è infallibile contro manipolazioni estreme delle immagini, ma offre un approccio tecnico promettente per consentire alle persone e alle organizzazioni di lavorare in modo responsabile con i contenuti generati dall’IA. Questo strumento potrebbe evolversi insieme ad altri modelli di intelligenza artificiale e modalità oltre all’immagine, come l’audio, il video e il testo.

Nuovo tipo di watermark per le immagini dell’IA

I watermark sono disegni che possono essere sovrapposti alle immagini per identificarle. Dalle impronte fisiche sulla carta al testo traslucido e ai simboli visibili sulle foto digitali di oggi, hanno subito un’evoluzione nel corso della storia.

I watermark tradizionali non sono sufficienti per identificare le immagini generate dall’IA perché spesso vengono applicati come un timbro su un’immagine e possono essere facilmente modificati. Ad esempio, i watermark discreti trovati nell’angolo di un’immagine possono essere ritagliati con tecniche di modifica di base.

Trovare il giusto equilibrio tra impercettibilità e resistenza alle manipolazioni delle immagini è difficile. I watermark altamente visibili, spesso aggiunti come uno strato con un nome o un logo nella parte superiore di un’immagine, presentano anche sfide estetiche per scopi creativi o commerciali. Allo stesso modo, alcuni watermark impercettibili sviluppati in precedenza possono essere persi attraverso semplici tecniche di modifica come il ridimensionamento.

Il watermark è rilevabile anche dopo modifiche come l'aggiunta di filtri, il cambio di colori e la luminosità.

Abbiamo progettato SynthID in modo che non comprometta la qualità dell’immagine e consenta al watermark di rimanere rilevabile, anche dopo modifiche come l’aggiunta di filtri, il cambio di colori e il salvataggio con vari schemi di compressione con perdita — i più comunemente utilizzati per i file JPEG.

SynthID utilizza due modelli di deep learning — per il watermarking e per l’identificazione — che sono stati addestrati insieme su un set diversificato di immagini. Il modello combinato è ottimizzato su una serie di obiettivi, tra cui l’identificazione corretta dei contenuti con watermark e il miglioramento dell’impercettibilità allineando visivamente il watermark al contenuto originale.

Approccio robusto e scalabile

SynthID consente ai clienti di Vertex AI di creare immagini generate da intelligenza artificiale in modo responsabile e di identificarle con fiducia. Sebbene questa tecnologia non sia perfetta, i nostri test interni mostrano che è accurata rispetto a molte comuni manipolazioni delle immagini.

L’approccio combinato di SynthID:

  • Watermarking: SynthID può aggiungere un watermark impercettibile alle immagini sintetiche prodotte da Imagen.
  • Identificazione: Scansionando un’immagine per il suo watermark digitale, SynthID può valutare la probabilità che un’immagine sia stata creata da Imagen.
SynthID può aiutare a valutare quanto è probabile che un'immagine sia stata creata da Imagen.

Questo strumento fornisce tre livelli di fiducia per interpretare i risultati dell’identificazione del watermark. Se viene rilevato un watermark digitale, è probabile che una parte dell’immagine sia stata generata da Imagen.

SynthID contribuisce all’ampia gamma di approcci per l’identificazione dei contenuti digitali. Uno dei metodi più diffusi per identificare i contenuti è tramite i metadati, che forniscono informazioni come chi li ha creati e quando. Queste informazioni vengono memorizzate con il file dell’immagine. Le firme digitali aggiunte ai metadati possono quindi mostrare se un’immagine è stata modificata.

Quando le informazioni dei metadati sono intatte, gli utenti possono identificare facilmente un’immagine. Tuttavia, i metadati possono essere rimossi manualmente o persino persi durante la modifica dei file. Poiché il watermark di SynthID è incorporato nei pixel di un’immagine, è compatibile con altri approcci di identificazione delle immagini basati sui metadati e rimane rilevabile anche quando i metadati vengono persi.

Qual è il prossimo passo?

Per creare contenuti generati da intelligenza artificiale in modo responsabile, ci impegniamo a sviluppare approcci sicuri, affidabili e di fiducia in ogni fase del processo, dalla generazione e identificazione delle immagini alla competenza nel campo dei media e alla sicurezza delle informazioni.

Questi approcci devono essere robusti e adattabili man mano che i modelli generativi avanzano ed espandono ad altri VoAGI. Speriamo che la nostra tecnologia SynthID possa collaborare con una vasta gamma di soluzioni per creatori e utenti in tutta la società, e continuiamo a evolvere SynthID raccogliendo feedback dagli utenti, migliorandone le capacità ed esplorando nuove funzionalità.

SynthID potrebbe essere esteso all’uso con altri modelli di intelligenza artificiale e siamo entusiasti del potenziale di integrarlo in più prodotti di Google e renderlo disponibile a terze parti nel prossimo futuro, per consentire alle persone e alle organizzazioni di lavorare in modo responsabile con contenuti generati da intelligenza artificiale.

Nota: Il modello utilizzato per la produzione di immagini sintetiche in questo blog potrebbe essere diverso dal modello utilizzato su Imagen e Vertex AI.

Per saperne di più su SynthID: https://www.deepmind.com/synthid

Leggi l’annuncio di Google Cloud: https://cloud.google.com/blog/products/ai-machine-learning/vertex-ai-next-2023-announcements