Esplora i coefficienti del modello
Ora esplorerai le prestazioni del modello da un'altra prospettiva, e solo sui dati di training. Nell'ultima lezione hai visto che non tutti i coefficienti del modello sono statisticamente significativi ed è bene consultare la tabella di riepilogo del modello per valutarne la significatività. Per fortuna, la libreria statsmodels offre questa funzionalità. Una volta stampata la tabella di riepilogo, individua quali variabili hanno un p-value inferiore a 0.05 (cioè inferiore al 5%) per assicurarti che il coefficiente sia significativo.
Le feature di training sono caricate come train_X, e la variabile target come train_Y, che è stata convertita in un array numpy.
Questo esercizio fa parte del corso
Machine Learning per il marketing con Python
Istruzioni dell'esercizio
- Importa il modulo
statsmodels.api. - Inizializza un'istanza del modello sui dati di training usando la funzione
OLS(). - Allena (fit) il modello.
- Stampa il riepilogo del modello usando il metodo
.summary().
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
# Import `statsmodels.api` module
import ___.___ as sm
# Initialize model instance on the training data
olsreg = sm.___(train_Y, train_X)
# Fit the model
olsreg = olsreg.___()
# Print model summary
print(olsreg.___())