Analizza il riepilogo del modello lineare
Analizzare le prestazioni dei diversi modelli con imputazione è una delle attività più importanti quando si gestiscono i dati mancanti. Questo passaggio determina su quale tipo di DataFrame imputato puoi fare affidamento. Per l’analisi, puoi adattare un modello di regressione lineare al DataFrame imputato e controllare vari parametri che influenzano la scelta del tipo di imputazione.
In questo esercizio hai già a disposizione il DataFrame diabetes_cc, che rappresenta il complete case del DataFrame sul diabete. Il complete case funge da base di confronto rispetto ad altri DataFrame imputati. Userai il pacchetto statsmodels.api caricato come sm per creare un modello di regressione lineare e generare i riepiloghi.
Questo esercizio fa parte del corso
Gestire i dati mancanti in Python
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
# Add constant to X and set X & y values to fit linear model
X = sm.add_constant(___)
y = ___
lm = sm.OLS(y, X).fit()