10 consigli e trucchi per Jupyter Notebook per gli scienziati dei dati

10 tips and tricks for Jupyter Notebook for data scientists

Sblocca il pieno potenziale di Jupyter Notebook con consigli e tecniche esperte, compresi scorciatoie che ti faranno risparmiare tempo, funzioni magiche potenti e funzionalità avanzate per aumentare la tua produttività.

Sia che tu sia un principiante o un professionista dei dati, devi aver usato il Jupyter Notebook e scoperto quanto sia facile eseguire il codice Python e visualizzare l’output in un formato di report.

Ma cosa succederebbe se ti dicessi che puoi migliorare la tua esperienza di sviluppo Jupyter? In questo post, impareremo 10 suggerimenti per il Jupyter Notebook per migliorare la produttività e le prestazioni dei professionisti dei dati.

1. Scorciatoie da tastiera

Le scorciatoie da tastiera sono importanti per eseguire compiti ripetitivi e risparmiare tempo. Puoi conoscere tutte le scorciatoie da tastiera predefinite tramite Aiuto > Scorciatoie da tastiera o premendo il tasto H.

Il modo più facile e popolare per accedere ai comandi “on the go” è una finestra di dialogo dei comandi simile a VSCode. Puoi premere Ctrl + Shift + P per invocare la finestra di dialogo dei comandi. Ti consente di cercare ed eseguire comandi o scorrere tutti i comandi per scoprire quello che vuoi eseguire.

2. Comandi magici di IPython

Puoi accedere a tutti i comandi magici di IPython all’interno del Jupyter Notebook. Questi comandi ti danno capacità extra nell’esecuzione del codice.

Ad esempio, puoi usare il comando magico %%time per visualizzare il tempo di esecuzione della cella. Nel nostro caso, il codice ha impiegato 1,09 secondi per eseguire 1000 iterazioni.

%%time

import time
for i in range(1_000):
    time.sleep(0.001)

CPU times: user 10.2 ms, sys: 1.68 ms, total: 11.9 ms
Wall time: 1.09 s

Puoi conoscere tutti i comandi magici disponibili eseguendo il comando %lsmagic o consultando i Comandi magici incorporati.

Elenco dei comandi comunemente utilizzati:

  • %env per impostare le variabili di ambiente.
  • %run per eseguire il codice Python.
  • %store per accedere alle variabili tra più notebook.
  • %%time fornisce il tempo di esecuzione di una cella.
  • %%writefile salva il contenuto della cella in un file.
  • %pycat mostra il contenuto del file esterno.
  • %pdb viene utilizzato per il debug.
  • %matplotlib inline per sopprimere l’output della funzione nell’ultima riga.

3. Esecuzione di comandi Shell

Puoi eseguire comandi Shell e Bash all’interno della cella del Jupyter Notebook utilizzando ! come mostrato di seguito. Ti fornisce la capacità extra di eseguire comandi e strumenti basati su Unix o Linux.

!git push origin

L’uso più popolare di questo comando è per installare pacchetti Python “on the go”.

!pip install numpy

Puoi anche installare pacchetti Python utilizzando il comando magico %pip

%pip install numpy

4. Utilizzo di LaTeX per le formule

Mentre crei il report dell’analisi dei dati, devi fornire equazioni statistiche o matematiche e Jupyter Notebook ti permette di rendere le equazioni complesse utilizzando le formule Latex.

Basta creare una cella Markdown e racchiudere la tua formula Latex con un segno di dollaro $, come mostrato di seguito.

$\int \frac{1}{x} dx = \ln \left| x \right| + C$

Output:

5. Installazione di altri kernel per Jupyter Notebook

Tutti conosciamo il kernel Python, ma puoi anche installare altri kernel ed eseguire il codice in qualsiasi linguaggio.

Ad esempio, se si desidera eseguire il linguaggio di programmazione R in Jupyter Notebook, è necessario installare R e installare IRkernel all’interno dell’ambiente R.

install.packages('IRkernel')
IRkernel::installspec()

In alternativa, se si ha installato Anaconda, è possibile eseguire il comando seguente nel terminale per configurare R per Jupyter Notebook.

conda install -c r r-essentials

Per gli amanti del linguaggio Julia, ho creato una semplice guida su come configurare Julia su Jupyter Notebook.

6. Eseguire il codice da un kernel diverso

È possibile eseguire il codice da più kernel all’interno di Python Jupyter Notebook utilizzando i comandi Magic come:

  • %%bash
  • %%html
  • %%javascript
  • %%perl
  • %%python3
  • %%ruby

Nell’esempio, proveremo a eseguire il codice HTML all’interno del kernel Python utilizzando il comando Magic %%HTML.

%%HTML

<html>

<body>

<h1>Ciao Mondo</h1>

<p>Benvenuto nel mio sito web</p>

</body>

</html>

Output:

Come per !, è possibile eseguire gli script Shell utilizzando %%script, che consente di eseguire tutti i kernel installati sulla propria macchina. Ad esempio, è possibile eseguire uno script R.

%%script R --no-save
print("Nisoo")

Output:

> print("Nisoo")
[1] "Nisoo"
>

7. Supporto per cursore multiplo

È possibile utilizzare cursori multipli per modificare più variabili e sintassi o aggiungere più righe di codice. Per creare cursori multipli, è necessario fare clic e trascinare il mouse tenendo premuto il tasto Alt.

8. Output di immagini, video e audio

È possibile visualizzare immagini, video e audio senza installare pacchetti Python aggiuntivi.

È sufficiente importare IPython.display per ottenere le funzioni Image, Video e Audio. È molto utile quando si lavora con insiemi di dati non strutturati e applicazioni di apprendimento automatico.

9. Elaborazione di grandi quantità di dati

È possibile elaborare e interrogare grandi set di dati utilizzando la libreria IPython Parallel. È la raccolta di script CLI per il controllo di cluster di processi IPython costruiti sul protocollo Jupyter.

Inoltre, è possibile utilizzare la sessione PySpark con il comando sparkmagic.

Guarda l’esempio dal repository sparkmagic.

%%spark -c sql -o df_employee--maxrows 5
SELECT * FROM employee

Output:

 age name
0   40.0    abid
1   20.0    Matt
2   36.0    Chris

10. Condivisione di Notebook

Condividere i report o il codice sorgente con gli output è importante e si può fare in diversi modi:

  1. Convertire i Notebook in file HTML utilizzando File > Download come > HTML.
  2. Salvare i Notebook come PDF utilizzando File > Download come > PDF.
  3. Salvare i Notebook come Markdown File > Download come > Markdown.
  4. Creare blog utilizzando Pelican.
  5. Caricare il file .ipynb su Google Colab e condividerlo tra i colleghi.
  6. Condividere il file Notebook con il pubblico utilizzando GitHub Gits.
  7. Hostare il proprio file su cloud o su server esterno e utilizzare nbviewer per renderizzare il Notebook.

Spero che la mia lista di 10 suggerimenti su Jupyter Notebook ti sia stata utile. Se hai suggerimenti o consigli aggiuntivi per Jupyter Notebook che vorresti condividere, non esitare a menzionarli nei commenti qui sotto. Grazie per la lettura.

Abid Ali Awan (@1abidaliawan) è un professionista certificato in scienze dei dati che ama costruire modelli di machine learning. Attualmente si sta concentrando sulla creazione di contenuti e sulla scrittura di blog tecnici su tecnologie di machine learning e data science. Abid ha una laurea magistrale in Technology Management e una laurea in Ingegneria delle Telecomunicazioni. La sua visione è quella di costruire un prodotto di intelligenza artificiale utilizzando una rete neurale grafica per gli studenti che lottano con malattie mentali.