Nuovo corso tecnico approfondito Fondamenti di Generative AI su AWS

Corso avanzato Generative AI su AWS

Le Fondamenta di Generative AI su AWS è un nuovo corso approfondito che ti fornisce i fondamenti concettuali, consigli pratici e assistenza pratica per pre-addestrare, affinare e distribuire modelli fondamentali all’avanguardia su AWS e oltre. Sviluppato da Emily Webber, responsabile mondiale delle fondamenta di generative AI di AWS, questo corso gratuito e pratico e il codice sorgente di supporto su GitHub sono stati lanciati su AWS Youtube. Se stai cercando una playlist selezionata delle migliori risorse, concetti e indicazioni per familiarizzare con i modelli fondamentali, in particolare quelli che sbloccano le capacità generative nei tuoi progetti di data science e machine learning, allora non cercare oltre.

Durante questa immersione approfondita di 8 ore, verrai introdotto alle tecniche chiave, ai servizi e alle tendenze che ti aiuteranno a comprendere i modelli fondamentali fin dalle basi. Ciò significa scomporre teoria, matematica e concetti astratti combinati con esercizi pratici per acquisire un’intuizione funzionale per l’applicazione pratica. Nel corso del corso, ci concentriamo su un’ampia gamma di tecniche di generative AI progressivamente complesse, fornendoti una solida base per comprendere, progettare e applicare i tuoi modelli per le migliori prestazioni. Inizieremo con un riepilogo dei modelli fondamentali, capendo da dove provengono, come funzionano, come sono collegati all’AI generativa e cosa puoi fare per personalizzarli. Poi imparerai a scegliere il modello fondamentale giusto per il tuo caso d’uso.

Una volta acquisita una solida comprensione contestuale dei modelli fondamentali e di come utilizzarli, verrai introdotto all’argomento principale di questo corso: il pre-addestramento di nuovi modelli fondamentali. Imparerai perché vorresti farlo, così come come e dove è competitivo. Imparerai anche come utilizzare le leggi di scalabilità per scegliere il modello, il set di dati e le dimensioni del calcolo giuste. Copriremo la preparazione di set di dati di addestramento su larga scala su AWS, incluso la scelta delle istanze e delle tecniche di archiviazione giuste. Approfondiremo il raffinamento dei modelli fondamentali, valutando le tecniche recenti e comprendendo come eseguirle con i tuoi script e modelli. Approfondiremo l’apprendimento per rinforzo con feedback umano, esplorando come usarlo abilmente e su larga scala per massimizzare davvero le prestazioni del tuo modello fondamentale.

Infine, imparerai come applicare la teoria alla produzione distribuendo il tuo nuovo modello fondamentale su Amazon SageMaker, incluso su più GPU e utilizzando i migliori pattern di progettazione come la generazione arricchita da recupero e il dialogo concatenato. Come bonus aggiuntivo, ti guideremo in una dettagliata analisi di Stable Diffusion, le migliori pratiche di ingegneria dei prompt, l’implementazione di LangChain e altro ancora.

Se preferisci leggere piuttosto che guardare video, puoi dare un’occhiata al mio libro di 15 capitoli “Pretrain Vision and Large Language Models in Python: Tecniche end-to-end per la costruzione e distribuzione di modelli fondamentali su AWS”, pubblicato il 31 maggio 2023 da Packt Publishing ed è disponibile su Amazon. Vuoi passare subito al codice? Sono con te: ogni video inizia con una panoramica di 45 minuti dei concetti chiave e delle visualizzazioni. Poi ti guiderò in una sessione pratica di 15 minuti. Tutti i notebook di esempio e il codice di supporto saranno disponibili in un repository pubblico, che potrai utilizzare per seguirli autonomamente. Non esitare a contattarmi su VoAGI, LinkedIn, GitHub o tramite i team di AWS. Scopri di più sull’AI generativa su AWS.

Buon divertimento!

Sommario del corso

1. Introduzione ai modelli fondamentali

  • Cosa sono i modelli di linguaggio di grandi dimensioni e come funzionano?
  • Da dove vengono?
  • Quali sono gli altri tipi di AI generativa?
  • Come personalizzare un modello fondamentale?
  • Come valutare un modello generativo?
  • Guida pratica: Modelli fondamentali su SageMaker

Diapositive lezione 1

Risorse dimostrative pratiche lezione 1

2. Scegliere il modello fondamentale giusto

  • Perché è importante partire dal modello fondamentale giusto
  • Considerare la dimensione
  • Considerare l’accuratezza
    • Considerare la facilità d’uso
  • Considerare la licenza
  • Considerare esempi precedenti di questo modello che ha funzionato bene nel tuo settore
    • Considerare benchmark esterni

Diapositive lezione 2

Risorse dimostrative pratiche lezione 2

3. Utilizzo di modelli fondamentali preaddestrati: ingegneria delle richieste e fine-tuning

  • I vantaggi di partire da un modello fondamentale preaddestrato
  • Ingegneria delle richieste:
    • Zero-shot
    • Single-shot
    • Few-shot
    • Sintesi
      • Classificazione
    • Traduzione
  • Fine-tuning
    • Fine-tuning classico
    • Fine-tuning efficiente dei parametri
    • La nuova libreria di Hugging Face
    • Esercitazione pratica: ingegneria delle richieste e fine-tuning su SageMaker

Diapositive della lezione 3

Risorse pratiche della lezione 3

4. Pretraining di un nuovo modello fondamentale

  • Perché si desidera o si ha bisogno di creare un nuovo modello fondamentale?
    • Confronto tra pretraining e fine-tuning
  • Preparazione del tuo dataset per il pretraining
  • Training distribuito su SageMaker: librerie, script, lavori, risorse
  • Perché e come adattare uno script nuovo al training distribuito di SageMaker

Diapositive della lezione 4

Risorse pratiche della lezione 4

5. Preparazione dei dati e training su larga scala

  • Opzioni per la preparazione dei dati su larga scala su AWS
  • Spiegazione del parallelismo dei lavori di SageMaker sulle istanze CPU
  • Spiegazione delle modalità di invio dei dati al training di SageMaker
  • Introduzione a FSx for Lustre
  • Utilizzo di FSx for Lustre su larga scala per il training di SageMaker
  • Esercitazione pratica: configurazione di Lustre per il training di SageMaker

Diapositive della lezione 5

Risorse pratiche della lezione 5

6. Apprendimento di rinforzo con feedback umano

  • Che tecnica è questa e perché ci interessa
  • Come supera i problemi di soggettività e oggettività attraverso la classificazione delle preferenze umane su larga scala
  • Come funziona?
  • Come fare questo con SageMaker Ground Truth
  • Aggiornamento della modellazione dei premi
  • Esercitazione pratica: RLFH su SageMaker

Diapositive della lezione 6

Risorse pratiche della lezione 6

7. Distribuzione di un modello fondamentale

  • Perché vogliamo distribuire modelli?
  • Diverse opzioni per la distribuzione di modelli fondamentali su AWS
  • Come ottimizzare il tuo modello per la distribuzione
  • Approfondimento sul contenitore di distribuzione di modelli di grandi dimensioni
  • Principali suggerimenti di configurazione per la distribuzione di modelli fondamentali su SageMaker
  • Suggerimenti per l’ingegneria delle richieste per l’invocazione di modelli fondamentali
  • Utilizzo della generazione arricchita da recupero per mitigare le allucinazioni
  • Esercitazione pratica: Distribuzione di un modello fondamentale su SageMaker

Diapositive della lezione 7

Risorse pratiche della lezione 7