Esplora i coefficienti del modello

Ora esplorerai le prestazioni del modello da un'altra prospettiva, e solo sui dati di training. Nell'ultima lezione hai visto che non tutti i coefficienti del modello sono statisticamente significativi ed è bene consultare la tabella di riepilogo del modello per valutarne la significatività. Per fortuna, la libreria statsmodels offre questa funzionalità. Una volta stampata la tabella di riepilogo, individua quali variabili hanno un p-value inferiore a 0.05 (cioè inferiore al 5%) per assicurarti che il coefficiente sia significativo.

Le feature di training sono caricate come train_X, e la variabile target come train_Y, che è stata convertita in un array numpy.

Questo esercizio fa parte del corso

Machine Learning per il marketing con Python

Visualizza corso

Istruzioni dell'esercizio

Importa il modulo statsmodels.api.
Inizializza un'istanza del modello sui dati di training usando la funzione OLS().
Allena (fit) il modello.
Stampa il riepilogo del modello usando il metodo .summary().

esercizio interattivo pratico

Prova questo esercizio completando questo codice di esempio.

# Import `statsmodels.api` module
import ___.___ as sm

# Initialize model instance on the training data
olsreg = sm.___(train_Y, train_X)

# Fit the model
olsreg = olsreg.___()

# Print model summary
print(olsreg.___())

Modifica ed esegui il codice