Sb3, il coltello svizzero dell’apprendimento rinforzato applicato
Sb3, la navaja suiza del aprendizaje reforzado aplicado
La tua scelta di modelli, con qualsiasi ambiente
Stablebaseline3 (sb3) è come un coltello svizzero. È uno strumento multi-funzione che può essere utilizzato per molti scopi. E, proprio come un coltello svizzero può salvarti la vita se ti trovi bloccato in una giungla, sb3 può salvarti la vita in ufficio, quando hai scadenze apparentemente impossibili da rispettare.
Questa guida utilizza gymnasium=0.28.1 e stable-baselines=2.1.0. Se utilizzi versioni diverse, o forse anche guide precedenti, potresti non ottenere i risultati qui sotto. Ma non preoccuparti, qui è anche fornita una guida all’installazione. Ti garantisco che otterrai i risultati se segui le mie istruzioni.
[1] Cosa otterrai qui
Stablebaseline3 è facile da usare. È anche ben documentato e puoi seguire i tutorial da solo. Ma…
- Hai consultato guide precedenti (magari quelle che utilizzano
gym
), solo per riscontrare errori sul tuo computer? - Sei in grado di garantire sempre la compatibilità?
- Cosa succede se vuoi utilizzare l’ambiente di
gymnasium
e modificare magari le ricompense? - Sai come incapsulare i tuoi compiti in modo tale che i modelli SOTA possano essere applicati in poche righe di codice?
Questo è l’obiettivo di questo articolo! Dopo aver letto questa dimostrazione guidata, sarai in grado di…
- Retini convoluzionali – Spiegate in modo intuitivo ed esaustivo
- Dalla piattaforma di dati alla piattaforma di apprendimento automatico
- Apprendimento rinforzato regolarizzato per entropia spiegato
- Risolvere ambienti classici con modelli sb3, visualizzare i risultati, nonché salvare (o caricare) il modello addestrato in poche righe di codice. [Sezione 3.1]
- Comprendere come verificare l’azione spaziale e lo spazio di osservazione per la compatibilità. [Sezione 3.2]
- Imparare come incapsulare gli ambienti di
gymnasium
in modo che possano essere utilizzati qualsiasi modello sb3, senza restrizioni subox
odiscrete
. [Sezione 4.1] - Imparare come incapsulare gli ambienti di
gymnasium
per la modifica delle ricompense. [Sezione 4.2] - Imparare come incapsulare i tuoi ambienti personalizzati in modo che siano compatibili con sb3, con modifiche minime al tuo codice originale che potrebbe seguire una struttura diversa. [Sezione 5]
[2] Installazione
Crea un ambiente virtuale e configura le dipendenze pertinenti. Mi rivolgo alla maggioranza – qui la guida è creata utilizzando Windows…