Spiegazione completa della regressione Softmax per etichette multiclasse con Python

Guida completa alla regressione Softmax per etichette multiclasse con Python

Classificazione multi-classe supervisionata nell’apprendimento automatico

Foto di James Harrison su Unsplash

Introduzione

Nella regressione logistica, affrontiamo una classe binaria, ovvero due classi nelle colonne di output. Tuttavia, nel mondo reale, otteniamo vari tipi di dati e a volte abbiamo più di due classi nella colonna di output. In questo caso, possiamo utilizzare la regressione softmax che è una regressione logistica multinomiale o un algoritmo di classificazione multi-classe. Per la regressione logistica, possiamo dire che è una forma di regressione softmax.

Alcuni apprendisti potrebbero pensare che stiamo affrontando un problema di classificazione, ma stiamo utilizzando la regressione nel nome dell’algoritmo. Poiché il calcolo base logistico è solo lineare, il ricercatore ha semplicemente aggiunto la funzione al loro output lineare per la classificazione.

La funzione softmax crea la distribuzione di probabilità per tutte le classi la cui somma degli output è pari a 1. Ad esempio, se abbiamo 4 classi nella colonna di output, le probabilità di queste classi possono essere [0,23, 0,45, 0,12, 0,20]. Significa che la classe con la probabilità più alta sarà probabilmente la previsione basata sull’input.

È molto importante vedere prima i dati, osservarli e trovare le colonne o caratteristiche di input e target. La prossima cosa da fare è controllare se c’è una colonna di output; in tal caso, sarà una regressione o una classificazione, altrimenti si userà un approccio basato su cluster se la colonna di output non è disponibile.

Dopo aver osservato tutte queste cose, il passo successivo è comprendere appieno le caratteristiche dei dati. Dopo aver letto le caratteristiche, i ricercatori possono facilmente interpretare quelle importanti che possono aiutare nella trasformazione dell’ingegneria delle caratteristiche.

Argomenti da trattare:

  1. Modello di regressione softmax senza utilizzare alcuna trasformazione
  2. Modello di regressione softmax utilizzando la trasformazione logaritmica per le colonne con distribuzione asimmetrica.
  3. Modello di regressione softmax utilizzando la ridimensionamento delle caratteristiche.

La parte successiva consiste nella visualizzazione dei dati.

Esempio di regressione softmax con Python:

import numpy as np import pandas as pd import seaborn as snsimport matplotlib.pyplot as pltfrom...