Retini convoluzionali – Spiegate in modo intuitivo ed esaustivo

Retini convoluzionali - Spiegate in modo chiaro e completo

Esplorare una strategia di modellizzazione fondamentale

“Convolved” dall'autore utilizzando MidJourney. Tutte le immagini sono dell'autore, salvo diversa indicazione.

Le reti neurali convoluzionali sono un punto di riferimento nella visione artificiale, nell’elaborazione del segnale e in un numero enorme di altre attività di apprendimento automatico. Sono piuttosto semplici e, di conseguenza, molte persone le danno per scontate senza comprenderle completamente. In questo articolo esamineremo la teoria delle reti convoluzionali, in modo intuitivo ed esaustivo, ed esploreremo le loro applicazioni in alcuni casi d’uso.

A chi è utile? A chi è interessato alla visione artificiale, all’analisi dei segnali o all’apprendimento automatico.

Quanto è avanzato questo post? Questo è un concetto molto potente, ma molto semplice; ottimo per i principianti. Potrebbe anche essere un buon ripasso per i data scientist esperti, in particolare per quanto riguarda le convoluzioni in diverse dimensioni.

Pre-requisiti: Una familiarità generale con la retropropagazione e le reti neurali dense potrebbe essere utile, ma non è obbligatoria. Ne parlo in entrambi questi post:

Cosa sono i gradienti e perché esplodono?

Leggendo questo post avrai una solida comprensione del concetto più importante nell’apprendimento profondo

towardsdatascience.com

Il motivo per cui esistono le reti convoluzionali

Il primo argomento che molti neofiti data scientist esplorano è una rete neurale densa. Questa è la classica rete neurale composta da nodi e archi che hanno determinati parametri apprendibili. Questi parametri consentono al modello di apprendere relazioni sottili sugli argomenti su cui vengono addestrati.

Un diagramma concettuale di una rete densa che riceve degli input e predice un output. Apprende i parametri necessari per funzionare bene al compito apprendendo progressivamente dagli esempi noti (cioè il successo e il fallimento delle squadre precedenti al Super Bowl).

Man mano che il numero di neuroni cresce all’interno della rete, le connessioni tra i livelli diventano sempre più abbondanti. Ciò può consentire ragionamenti complessi, il che è fantastico, ma la “densità” delle reti dense presenta un problema quando si tratta di immagini.

Supponiamo che vogliamo addestrare una rete neurale densa per predire se un’immagine contiene o meno un cane. Potremmo creare una rete densa che analizza ogni pixel dell’immagine…