Questo articolo sull’IA propone un nuovo metodo basato sui gradienti chiamato Cones per analizzare e identificare i neuroni concetto nei modelli di diffusione.

Questo articolo propone un nuovo metodo basato sui gradienti chiamato Cones per analizzare e identificare i neuroni concetto nei modelli di diffusione.

La complessa struttura del cervello gli consente di svolgere straordinarie attività cognitive e creative. Secondo le ricerche, i neuroni concettuali del lobo temporale mediale umano reagiscono in modo diverso alle caratteristiche semantiche degli stimoli dati. Questi neuroni, ritenuti la base dell’intelletto di alto livello, memorizzano connessioni temporali e astratte tra gli elementi dell’esperienza attraverso intervalli spaziotemporali. È quindi interessante scoprire se le reti neurali profonde contemporanee accettano una struttura simile a quella dei neuroni concettuali come uno dei sistemi di intelligenza artificiale più efficaci.

I modelli di diffusione generativa codificano specificamente diversi soggetti in modo indipendente con i loro neuroni per emulare la capacità creativa del cervello umano? I ricercatori cinesi hanno affrontato questa domanda dal punto di vista di una generazione guidata dal soggetto. In base alla semantica del testo di input, suggeriscono di individuare un piccolo cluster di neuroni che sono parametri nello strato di attenzione di un modello di diffusione preaddestrato da testo a immagine, in modo tale che la modifica dei valori di quei neuroni possa creare un argomento corrispondente in vari contenuti. Questi neuroni vengono identificati come neuroni concettuali collegati al soggetto rilevante nei modelli di diffusione. Identificarli può aiutarci a conoscere meglio il funzionamento fondamentale delle reti di diffusione profonde e offrire un nuovo approccio alla generazione guidata dal soggetto. I neuroni concettuali noti come Cones1 sono analizzati e identificati utilizzando un unico approccio basato sui gradienti proposto in questo studio. Li utilizzano come parametri di riduzione di scala il cui valore assoluto può creare in modo più efficace l’argomento fornito pur conservando la conoscenza esistente. Questo motivo può indurre un criterio basato sui gradienti per determinare se un parametro è un neurone concettuale. Dopo alcuni calcoli dei gradienti, possono utilizzare questo criterio per individuare tutti i neuroni concettuali. L’interpretabilità di quei neuroni concettuali viene quindi esaminata da varie angolazioni.

Iniziano esaminando quanto siano resistenti i neuroni concettuali ai cambiamenti nei loro valori. Utilizzano la precisione digitale float32, float16, quaternaria e binaria per ottimizzare una perdita di impianto di concetto sui neuroni concettuali, chiudendo direttamente quei neuroni concettuali senza addestramento. Poiché la precisione digitale binaria occupa meno spazio di archiviazione e non richiede addestramento aggiuntivo, la utilizzano come loro tecnica predefinita per la creazione guidata dal soggetto. I risultati indicano una prestazione coerente in tutte le situazioni, mostrando l’elevata robustezza dei neuroni nella gestione dell’argomento desiderato. La concatenazione dei neuroni concettuali provenienti da diversi soggetti può produrli tutti nelle scoperte utilizzando questo approccio, che consente anche una additività interessante. Questa scoperta di una struttura semantica affine semplice ma potente nello spazio dei parametri del modello di diffusione potrebbe essere una prima volta. Il raffinamento ulteriore basato sulla concatenazione può far avanzare la capacità di generazione multi-concetto verso un nuovo traguardo: sono i primi nella generazione guidata dal soggetto a produrre con successo quattro soggetti distinti e disparati in un’unica immagine.

Infine, i neuroni possono essere utilizzati in modo efficace in applicazioni su larga scala grazie alla loro scarsità e resilienza. Molte indagini su varie categorie, tra cui ritratti umani, ambientazioni, decorazioni, ecc., mostrano che l’approccio è superiore in termini di interpretabilità e può generare diversi concetti. Confrontando gli approcci attuali guidati dal soggetto, l’archiviazione dei dati necessari per sviluppare un soggetto specifico utilizza solo circa il 10% della memoria, rendendolo estremamente conveniente dal punto di vista economico e ecologico per l’uso su dispositivi mobili.

Consulta il Articolo. Tutti i crediti per questa ricerca vanno ai ricercatori di questo progetto. Inoltre, non dimenticare di unirti al nostro SubReddit di ML con oltre 26.000 iscritti, al Canale Discord e alla Newsletter via Email, dove condividiamo le ultime notizie sulla ricerca nell’ambito dell’intelligenza artificiale, progetti interessanti di intelligenza artificiale e altro ancora.

Svelare i segreti del deep learning con la piattaforma di spiegabilità di Tensorleap

L’articolo Questo articolo sull’IA propone un nuovo metodo basato sui gradienti chiamato Cones per analizzare e identificare i neuroni concettuali nei modelli di diffusione è apparso per primo su MarkTechPost.