I ricercatori dell’Università della Pennsylvania hanno introdotto un approccio alternativo di intelligenza artificiale per progettare e programmare i computer serbatoio basati su RNN.
I ricercatori dell'Università della Pennsylvania hanno introdotto un nuovo approccio di intelligenza artificiale per progettare e programmare i computer serbatoio basati su RNN.
Il cervello umano è uno dei sistemi più complessi mai creati dalla natura. I neuroni interagiscono tra loro formando collegamenti neurali ricorrenti e trasmettendo informazioni attraverso impulsi. Grazie ai loro incredibili metodi di ragionamento logico e di analisi numerica, i ricercatori cercano di implementare questi metodi biologici di reti neurali nei sistemi neurali artificiali attuali. I metodi di calcolo neurale coinvolgono le reti neurali ricorrenti (RNN) in sistemi dinamici e le repliche neurali delle architetture informatiche nell’apprendimento automatico.
Il gruppo di ricerca afferma che i progressi nella tecnologia attuale delle reti neurali potrebbero consentire l’esecuzione neurale distribuita completa della virtualizzazione del software e dei circuiti logici. Ciò sarebbe realizzato senza la necessità di dati di esempio o campionamento dello spazio degli stati, che di solito sono richiesti per addestrare e affinare queste reti neurali. Fondamentalmente, questo suggerisce il potenziale di un’applicazione più efficiente e robusta dell’intelligenza artificiale in aree come la virtualizzazione e la progettazione di circuiti digitali.
L’accesso attuale al calcolo neurale è limitato a causa della necessità di comprendere la relazione tra i computer neurali e i computer al silicio moderni. Ciò richiede una rete neurale con un semplice insieme di equazioni di gestione che gestiscono molte capacità simili a quelle di un computer. Come conseguenza del semplice insieme di equazioni, le reti come il “reservoir computer” (RC), che è una rete neurale ricorrente (RNN), sono ben comprese teoricamente. Al ricevere gli input, queste reti evolvono come un insieme di stati interni, e l’output è una somma pesata di quegli stati.
- 8 Ragioni per cui non ho rinunciato al mio sogno di diventare un Data Scientist e perché nemmeno tu dovresti farlo
- 10 migliori strumenti di cambiamento vocale AI (luglio 2023)
- CarperAI presenta OpenELM una libreria open-source progettata per abilitare la ricerca evolutiva con modelli linguistici sia nel codice che nel linguaggio naturale.
Il team di ricerca dell’Università della Pennsylvania ha sviluppato due strutture chiamate “state neural programming” (SNP) e “dynamic neural programming” (DNP). Viene utilizzato RC per risolvere equazioni analitiche e svolgere operazioni, mentre viene utilizzato SNP per programmare RC per memorizzare sistemi dinamici caotici come memorie ad accesso casuale, implementando la logica neurale AND, NAND, OR, NOR, XOR e XNOR.
Attraverso l’architettura “Open-Loop con SNP”, i ricercatori hanno ottenuto una matrice di programmazione con potenze polinomiali di input ritardati nel tempo, che possono essere utilizzate nelle operazioni come un filtro passa-alto. Per risolvere algoritmi, viene utilizzata l’architettura “Closed-loop con SNP” in cui viene programmata una RNN per memorizzare la storia temporale sostanziale di una serie temporale stocastica e non differenziabile, e viene eseguita una trasformata di Fourier a tempo breve.
La simulazione e la virtualizzazione richiedono la programmazione della storia temporale per una RNN a tempo continuo, quindi viene implementata una RNN “Closed-loop” con il metodo DNP. I ricercatori hanno cercato di emulare la dinamica del feedback di una RNN host di 2000 stati e una RNN ospite di 15 stati. Hanno scoperto che si tratta semplicemente di simulare un attrattore caotico di Lorentz senza alcun campione. Questo porta alla conclusione che:
I ricercatori hanno scoperto che un framework di calcolo alternativo può essere completamente programmabile, mettendo in discussione gli approcci attuali che imitano l’hardware al silicio. Invece, propongono di concentrarsi sulla creazione di sistemi di programmazione specifici che massimizzino le piena capacità di calcolo di ogni sistema unico.