Evitare il sovradattamento nelle reti neurali un approfondimento

Evitare l'overfitting nelle reti neurali un approfondimento

Scopri come implementare tecniche di regularizzazione per migliorare le prestazioni e prevenire l’overfitting della rete neurale

Fonte immagine: unsplash.com.

Quando addestriamo una rete neurale profonda, spesso è difficile raggiungere le stesse prestazioni sia sul set di addestramento che sul set di convalida. Un errore significativamente più alto sul set di convalida è un chiaro segnale di overfitting: la rete si è specializzata troppo sui dati di addestramento. In questo articolo, fornisco una guida completa su come aggirare questo problema.

Overfitting delle Reti Neurali

Quando ci si occupa di qualsiasi applicazione di apprendimento automatico, è importante avere una chiara comprensione del bias e della varianza del modello. Nei tradizionali algoritmi di apprendimento automatico, parliamo del tradeoff tra bias e varianza, che consiste nella sfida di minimizzare sia la varianza che il bias di un modello.

Per ridurre il bias di un modello (ovvero il suo errore da false assunzioni), abbiamo bisogno di un modello più complesso. Al contrario, ridurre la varianza del modello (la sensibilità del modello nel catturare le variazioni dei dati di addestramento) implica un modello più semplice. È ovvio che il tradeoff tra bias e varianza, nel tradizionale apprendimento automatico, deriva dal conflitto di necessitare contemporaneamente un modello più complesso e un modello più semplice.

Nell’era del Deep Learning, abbiamo strumenti per ridurre solo la varianza del modello senza compromettere il bias del modello o, al contrario, per ridurre il bias senza aumentare la varianza.

Prima di esplorare le diverse tecniche utilizzate per prevenire l’overfitting di una rete neurale, è importante chiarire cosa significa alta varianza o alto bias.

Considera un comune compito di una rete neurale come il riconoscimento delle immagini e pensa a una rete neurale che riconosce la presenza di panda in una foto. Possiamo affermare con sicurezza che un essere umano può svolgere questo compito con un errore quasi pari a zero. Di conseguenza, questo è un benchmark ragionevole per l’accuratezza della rete di riconoscimento delle immagini. Dopo aver addestrato la rete neurale sul set di addestramento ed valutandone le prestazioni sia sul set di addestramento che sul set di convalida, possiamo ottenere risultati diversi: