Analizza il riepilogo del modello lineare

Analizzare le prestazioni dei diversi modelli con imputazione è una delle attività più importanti quando si gestiscono i dati mancanti. Questo passaggio determina su quale tipo di DataFrame imputato puoi fare affidamento. Per l’analisi, puoi adattare un modello di regressione lineare al DataFrame imputato e controllare vari parametri che influenzano la scelta del tipo di imputazione.

In questo esercizio hai già a disposizione il DataFrame diabetes_cc, che rappresenta il complete case del DataFrame sul diabete. Il complete case funge da base di confronto rispetto ad altri DataFrame imputati. Userai il pacchetto statsmodels.api caricato come sm per creare un modello di regressione lineare e generare i riepiloghi.

Questo esercizio fa parte del corso

Gestire i dati mancanti in Python

Visualizza corso

esercizio interattivo pratico

Prova questo esercizio completando questo codice di esempio.

# Add constant to X and set X & y values to fit linear model
X = sm.add_constant(___)
y = ___
lm = sm.OLS(y, X).fit()

Modifica ed esegui il codice