Introduzione all’Apprendimento Statistico, Edizione Python Libro gratuito
Introduzione all'Apprendimento Statistico, Edizione Python
Da anni, Introduzione all’Apprendimento Statistico con Applicazioni in R, meglio conosciuto come ISLR, è stato apprezzato da principianti e professionisti del machine learning come uno dei migliori libri di machine learning.
Ora che è qui l’edizione Python del libro, Introduzione all’Apprendimento Statistico con Applicazioni in Python, o ISL con Python, la comunità è ancora più entusiasta!
- Guida completa alle funzioni finanziarie in Excel
- Stability AI’s Stable Diffusion XL 1.0 Una svolta nella generazione di immagini tramite intelligenza artificiale
- Robot parlante Il nostro nuovo modello di intelligenza artificiale traduce la visione e il linguaggio in azioni robotiche
ISL con Python è Qui. Fantastico! Ma Perché?
Sono felice che tu abbia chiesto. 😀
Se hai esperienza nel campo del machine learning, è probabile che tu abbia già sentito parlare, letto o utilizzato la versione R del libro in precedenza. E sai cosa ti piaceva di più. Ma ecco la mia storia.
L’estate prima di iniziare il mio corso di laurea magistrale, ho deciso di imparare il machine learning da solo. Sono stato fortunato ad imbattermi in ISLR all’inizio del mio percorso di apprendimento del machine learning. Gli autori di ISLR fanno un ottimo lavoro nel semplificare gli algoritmi complessi del machine learning in modo facile da seguire, insieme alle necessarie basi matematiche, senza sovraccaricare gli studenti. Questo è un aspetto del libro che ho apprezzato.
Gli esempi di codice e i laboratori in ISLR, tuttavia, sono in R. Purtroppo, all’epoca non conoscevo R, ma ero abile nella programmazione in Python. Quindi avevo due opzioni.
Potevo imparare R da solo. Oppure potevo utilizzare altre risorse, come tutorial e documentazione, per creare modelli in Python. Come la maggior parte degli altri Pythonisti, ho scelto la seconda opzione (sì, la strada più familiare, lo so).
Mentre R è ottimo per l’analisi statistica, Python è un buon primo linguaggio se stai appena iniziando il tuo percorso nel campo dei dati.
Ma questo non è più un problema! Perché questa nuova edizione Python ti consente di scrivere codice e creare modelli di machine learning in Python. Non ci sono più preoccupazioni su dover imparare un nuovo linguaggio di programmazione per seguire il libro.
La storia è finita! Diamo un’occhiata più da vicino ai contenuti del libro.
Contenuti di ISL con Python
Per quanto riguarda il contenuto, l’edizione Python è molto simile all’edizione R. Tuttavia, è un’adattamento appropriato per Python, come ci si aspetta. Questo libro include anche una sezione di crash course di programmazione in Python per imparare le basi.
Questo libro copre una vasta gamma di argomenti. Dalle fondamenta dell’apprendimento statistico, agli algoritmi di apprendimento supervisionato e non supervisionato, fino all’apprendimento profondo e altro ancora, il libro è organizzato nei seguenti capitoli:
- Apprendimento statistico
- Regressione lineare
- Classificazione
- Metodi di campionamento
- Selezione e regolarizzazione del modello lineare
- Oltre la linearità
- Metodi basati su alberi
- Support Vector Machines
- Apprendimento profondo (copre reti neurali vanilla, ConvNet e reti neurali ricorrenti)
- Analisi di sopravvivenza e dati censurati
- Apprendimento non supervisionato
- Test multipli (un approfondimento sui test di ipotesi)
Il pacchetto Python ISLP
Il libro utilizza dataset provenienti da repository pubblici come l’UCI Machine Learning repository e altre risorse simili. Alcuni esempi includono dataset su condivisione delle biciclette, default delle carte di credito, gestione dei fondi e tassi di criminalità.
Imparare a raccogliere dati da varie fonti attraverso il processo di web scraping e l’importazione di dati da diverse fonti è estremamente importante per un progetto di data science.
Tuttavia, per uno studente che non è familiare con la fase di raccolta dei dati, può essere un ostacolo nel processo di apprendimento se vogliono utilizzare il libro per imparare sia la teoria che le sezioni pratiche.
Per facilitare un’esperienza di apprendimento senza intoppi, il libro è accompagnato da un pacchetto ISLP:
- Il pacchetto ISLP è disponibile per tutte le principali piattaforme: Linux, Windows e MacOS.
- Puoi installare ISLP utilizzando il comando pip:
pip install islp
, preferibilmente in un ambiente virtuale sul tuo computer.
Il pacchetto ISLP ha una documentazione completa. Il pacchetto ISLP viene fornito con utility per il caricamento dei dati. Quando si lavora con un dataset particolare, la pagina dei documenti fornisce informazioni pronte all’uso sulle varie caratteristiche presenti nel dataset, sul numero di record e sul codice di avvio per caricare i dati in un dataframe di pandas.
Dispone anche di funzioni di supporto e di funzionalità per creare funzionalità di ordine superiore come funzioni polinomiali e a spline.
Per un’esperienza di apprendimento più completa, è possibile leggere i dati dalle loro fonti, eseguire l’ingegneria delle caratteristiche senza utilizzare il pacchetto ISLP.
Quando si creano modelli, è possibile provare l’implementazione solo con scikit-learn e PyTorch o Keras per le sezioni di deep learning.
Allora, per chi è di nuovo questo libro?
Principianti in Data Science e Machine Learning: Se sei un principiante che preferisce un percorso di auto-apprendimento per imparare il machine learning, questo libro è una grande risorsa didattica.
Praticanti di ML: Come praticante di machine learning, avrai esperienza nella creazione di modelli di machine learning. Ma tornare alle basi come il testing delle ipotesi e altri algoritmi può essere utile.
Educatori: La teoria e i laboratori insieme rendono questo libro un ottimo compagno per un primo corso di machine learning. La maggior parte delle università e delle bootcamp di data science insegnano oggi il machine learning. Quindi, se sei un educatore che sta insegnando o che cerca di insegnare un corso di machine learning, questo è un ottimo libro di testo da considerare.
Conclusione
E questo è tutto. L’introduzione all’apprendimento statistico con Python è stata una delle uscite più entusiasmanti di quest’estate.
Puoi andare su statlearning.com e iniziare a leggere l’edizione Python. Anche se la copia digitale è gratuita, la versione cartacea su Amazon è esaurita il primo giorno. Quindi siamo entusiasti di vederti trarre il massimo dal libro. Inizia a leggerlo oggi. Buon apprendimento! Bala Priya C è una sviluppatrice e scrittrice tecnica dell’India. Le piace lavorare all’intersezione tra matematica, programmazione, data science e creazione di contenuti. Le sue aree di interesse e competenza includono DevOps, data science e elaborazione del linguaggio naturale. Ama leggere, scrivere, programmare e il caffè! Attualmente sta lavorando per imparare e condividere le sue conoscenze con la comunità degli sviluppatori scrivendo tutorial, guide pratiche, articoli di opinione e altro ancora.