Ricercatori dello Skoltech e dell’AIRI hanno sviluppato un nuovo algoritmo per il trasferimento ottimale dei dati tra domini utilizzando reti neurali

Ricercatori Skoltech e AIRI sviluppato algoritmo trasferimento dati tra domini con reti neurali

Dalla comparsa di GAN OT e Wasserstein su larga scala, l’apprendimento automatico ha sempre più abbracciato l’uso di reti neurali per risolvere i problemi di trasporto ottimo (OT). Il piano OT è stato recentemente dimostrato come modello generativo con prestazioni comparabili in compiti reali. Il costo OT viene spesso calcolato e utilizzato come funzione di perdita per aggiornare il generatore nei modelli generativi.

L’Istituto di Ricerca sull’Intelligenza Artificiale (AIRI) e Skoltech hanno collaborato a un nuovo algoritmo per ottimizzare la condivisione delle informazioni tra discipline utilizzando reti neurali. I fondamenti teorici dell’algoritmo rendono il suo output più facilmente comprensibile rispetto ai metodi concorrenti. A differenza di altri approcci che necessitano di set di dati di addestramento accoppiati come esempi input-output, il nuovo approccio può essere addestrato su set di dati separati dai domini di input e output.

I grandi set di dati di addestramento sono difficili da ottenere, ma sono necessari per i moderni modelli di apprendimento automatico sviluppati per applicazioni come il riconoscimento facciale o vocale e l’analisi delle immagini mediche. Per questo motivo, scienziati e ingegneri spesso ricorrono alla simulazione di set di dati del mondo reale attraverso mezzi artificiali. I recenti progressi nei modelli generativi hanno reso questo compito molto più facile migliorando notevolmente la qualità del testo e delle immagini generate.

Una rete neurale viene insegnata a generalizzare ed estendere da campioni di addestramento accoppiati e set di immagini input-output a nuove immagini in arrivo; ciò è utile per lavori in cui devono essere elaborate molte foto identiche di qualità variabile. In altre parole, i modelli generativi facilitano la transizione da un dominio all’altro sintetizzando dati provenienti da dati diversi. Ad esempio, una rete neurale può convertire un disegno a mano in un’immagine digitale o migliorare la chiarezza di una foto satellitare.

L’allineamento delle distribuzioni di probabilità con mappe di trasporto deterministiche e stocastiche è un uso unico della tecnologia, che è uno strumento generale. Il metodo migliorerà i modelli esistenti in domini diversi dalla traduzione non accoppiata (ripristino delle immagini, adattabilità dei domini, ecc.). L’approccio consente un maggiore controllo sul livello di varietà nei campioni prodotti e un’interpretazione migliore della mappa appresa rispetto ai metodi comuni basati su GAN o modelli di diffusione. Le mappe OT acquisite dai ricercatori potrebbero richiedere una revisione per le attività non accoppiate. I ricercatori evidenziano la progettazione del costo di trasporto per determinati compiti come un’area di studio potenziale.

L’intersezione tra trasporto ottimale e apprendimento generativo è al centro dell’approccio scelto. I settori dell’intrattenimento, del design, della grafica computerizzata, del rendering, ecc., utilizzano ampiamente modelli generativi e trasporto efficiente. Diversi problemi nei settori sopra citati potrebbero essere adatti all’approccio. Il possibile svantaggio è che alcune professioni nel settore della grafica potrebbero essere influenzate dall’uso degli strumenti precedenti, che consentono di rendere disponibili pubblicamente le tecnologie di elaborazione delle immagini.

Spesso i ricercatori si devono accontentare di set di dati non correlati invece dei dati ideali corrispondenti a causa del costo proibitivo o della difficoltà di acquisizione. Il team è tornato ai testi del matematico ed economista sovietico Leonid Kantorovich, attingendo alle sue idee sul trasporto ottimo efficiente (la teoria del trasporto ottimale) per sviluppare un nuovo metodo per la pianificazione del trasferimento ottimale dei dati tra domini. Il trasporto ottimale neurale è un nuovo approccio che utilizza reti neurali profonde e set di dati separati.

Quando viene valutato il trasferimento di dominio non accoppiato, l’algoritmo ottiene risultati migliori rispetto agli approcci all’avanguardia nella stilizzazione delle immagini e in altri compiti. Inoltre, richiede meno iperparametri, che sono tipicamente difficili da regolare, ha un risultato più interpretabile e si basa su una solida base matematica rispetto ai metodi concorrenti.