Ritorno alle Basi Settimana 3 Introduzione all’Apprendimento Automatico

Ritorno alle basi Settimana 3 - Introduzione all'Apprendimento Automatico

Unisciti a VoAGI con il nostro percorso Torna alle Basi per iniziare una nuova carriera o rivedere le tue competenze di data science. Il percorso Torna alle Basi è diviso in 4 settimane con una settimana bonus. Speriamo che tu possa utilizzare questi blog come guida per il corso.

Se non l’hai ancora fatto, dai un’occhiata a:

Andando alla terza settimana, approfondiremo il machine learning.

  • Giorno 1: Demistificazione del Machine Learning
  • Giorno 2: Guida introduttiva a Scikit-learn in 5 passaggi
  • Giorno 3: Comprensione del Machine Learning Supervisionato: Teoria e Panoramica
  • Giorno 4: Esperienza pratica con il Machine Learning Supervisionato: Regressione Lineare
  • Giorno 5: Svelare il Machine Learning Non Supervisionato
  • Giorno 6: Esperienza pratica con il Machine Learning Non Supervisionato: Clustering K-Means
  • Giorno 7: Metriche di Valutazione del Machine Learning: Teoria e Panoramica

Demistificazione del Machine Learning

Settimana 3 – Parte 1: Demistificazione del Machine Learning

Tradizionalmente, i computer seguivano un insieme esplicito di istruzioni. Ad esempio, se volevi far svolgere al computer un compito semplice come l’addizione di due numeri, dovevi specificare ogni passaggio. Tuttavia, man mano che i nostri dati sono diventati più complessi, questo approccio manuale di dare istruzioni per ogni situazione è diventato inadeguato.

È qui che il Machine Learning è emerso come un cambio di gioco. Volevamo che i computer imparassero dagli esempi proprio come impariamo dalle nostre esperienze. Immagina di insegnare a un bambino come andare in bicicletta mostrandoglielo alcune volte e poi lasciandolo cadere, capire da solo e imparare da solo. Questa è l’idea alla base del Machine Learning. Questa innovazione non solo ha trasformato le industrie, ma è diventata una necessità indispensabile nel mondo di oggi.

Iniziare con Scikit-learn in 5 passaggi

Settimana 3 – Parte 2: Iniziare con Scikit-learn in 5 passaggi

Questo tutorial offre una guida pratica completa al machine learning con Scikit-learn. I lettori impareranno concetti e tecniche chiave, tra cui la preelaborazione dei dati, l’addestramento e la valutazione del modello, l’ottimizzazione degli iperparametri e la compilazione di modelli ensemble per prestazioni migliorate.

Quando impariamo come utilizzare Scikit-learn, ovviamente dobbiamo avere una comprensione esistente dei concetti sottostanti del machine learning, poiché Scikit-learn non è altro che uno strumento pratico per implementare principi di machine learning e compiti correlati. Il machine learning è una sotto-categoria dell’intelligenza artificiale che consente ai computer di apprendere e migliorare dall’esperienza senza essere programmati esplicitamente. Gli algoritmi utilizzano dati di addestramento per fare previsioni o decisioni scoprendo modelli ed intuizioni.

Comprensione del Machine Learning Supervisionato: Teoria e Panoramica

Settimana 3 – Parte 3: Comprensione del Machine Learning Supervisionato: Teoria e Panoramica

Il Supervised è una sotto-categoria del machine learning in cui il computer impara dall’insieme di dati etichettati che contiene sia l’input che l’output corretto. Cerca di trovare la funzione di mappatura che collega l’input (x) all’output (y). Puoi pensare a questo come insegnare a tuo fratello o tua sorella più piccoli come riconoscere diversi animali. Gli mostrerai alcune immagini (x) e gli dirai come si chiama ciascun animale (y).

Dopo un certo periodo di tempo, impareranno le differenze e saranno in grado di riconoscere correttamente la nuova immagine. Questa è l’intuizione di base dietro l’apprendimento supervisionato.

 

Prova pratica con l’apprendimento supervisionato: regressione lineare

 

Settimana 3 – Parte 4: Prova pratica con l’apprendimento supervisionato: regressione lineare

Se stai cercando un’esperienza pratica con un tutorial dettagliato, ma adatto ai principianti, sull’implementazione della regressione lineare utilizzando Scikit-learn, ti aspetta un viaggio coinvolgente.

La regressione lineare è l’algoritmo di apprendimento automatico supervisionato fondamentale per la previsione delle variabili continue sulla base delle caratteristiche di input. Come suggerisce il nome, si assume che la relazione tra la variabile dipendente e la variabile indipendente sia lineare.

Quindi, se proviamo a tracciare la variabile dipendente Y rispetto alla variabile indipendente X, otterremo una linea retta.

 

Scoprire l’apprendimento non supervisionato

 

Settimana 3 – Parte 5: Scoprire l’apprendimento non supervisionato

Esplora il paradigma dell’apprendimento non supervisionato. Familiarizza con i concetti chiave, le tecniche e gli algoritmi popolari dell’apprendimento non supervisionato.

Nell’apprendimento automatico, l’apprendimento non supervisionato è un paradigma che prevede l’addestramento di un algoritmo su un set di dati non etichettati. Quindi non ci sono supervisione o output etichettati.

Nell’apprendimento non supervisionato, l’obiettivo è scoprire modelli, strutture o relazioni all’interno dei dati stessi, piuttosto che prevedere o classificare basandosi su esempi etichettati. Coinvolge l’esplorazione della struttura intrinseca dei dati per ottenere intuizioni e comprendere informazioni complesse.

 

Prova pratica con l’apprendimento non supervisionato: clustering K-Means

 

Settimana 3 – Parte 6: Prova pratica con l’apprendimento non supervisionato: clustering K-Means

Questo tutorial fornisce un’esperienza pratica con i concetti chiave e l’implementazione del clustering K-Means, un popolare algoritmo di apprendimento non supervisionato, per la segmentazione dei clienti e le applicazioni di pubblicità mirata.

Il clustering K-Means è uno degli algoritmi di apprendimento non supervisionato più comunemente utilizzati nella scienza dei dati. Viene utilizzato per suddividere automaticamente i set di dati in cluster o gruppi sulla base delle somiglianze tra i punti dati.

In questo breve tutorial, impareremo come funziona l’algoritmo di clustering K-Means e lo applicheremo a dati reali utilizzando scikit-learn. Inoltre, visualizzeremo i risultati per comprendere la distribuzione dei dati.

 

Metriche di valutazione dell’apprendimento automatico: teoria e panoramica

 

Settimana 3 – Parte 7: Metriche di valutazione dell’apprendimento automatico: teoria e panoramica

Esplorazione di alto livello delle metriche di valutazione nell’apprendimento automatico e della loro importanza.

Costruire un modello di apprendimento automatico che generalizza bene su nuovi dati è molto sfidante. Deve essere valutato per capire se il modello è sufficientemente buono o necessita di alcune modifiche per migliorare le prestazioni.

Se il modello non apprende sufficientemente i pattern dal set di addestramento, si comporterà male sia sul set di addestramento che sul set di test. Questo è il problema dell’underfitting.

Imparare troppo sui pattern dei dati di addestramento, incluso il rumore, porterà il modello a funzionare molto bene sul set di addestramento, ma a funzionare male sul set di test. Questa situazione è l’overfitting. La generalizzazione del modello può essere ottenuta se le prestazioni misurate sia nel set di addestramento che nel set di test sono simili.

 

Conclusione

 

Congratulazioni per aver completato la settimana 3!!

Il team di VoAGI spera che il percorso Back to Basics abbia fornito ai lettori un approccio completo e strutturato per padroneggiare i fondamenti della scienza dei dati.

La settimana 4 sarà pubblicata la prossima settimana lunedì – rimanete sintonizzati!  

****[Nisha Arya](https://www.linkedin.com/in/nisha-arya-ahmed/)**** è una Data Scientist e Scrittrice Tecnica Freelance. È particolarmente interessata a fornire consigli di carriera o tutorial nel campo della Data Science e conoscenze teoriche. Desidera anche esplorare i diversi modi in cui l’Intelligenza Artificiale può beneficiare la longevità della vita umana. Una studentessa appassionata, desiderosa di approfondire le sue conoscenze tecnologiche e le sue capacità di scrittura, aiutando nel frattempo gli altri a orientarsi.