Analise o resumo do modelo linear
Analisar o desempenho dos diferentes modelos com imputação é uma das tarefas mais importantes ao lidar com dados ausentes. Isso determina em qual tipo de DataFrame imputado você pode confiar. Para a análise, você pode ajustar um modelo de regressão linear no DataFrame imputado e verificar vários parâmetros que impactam a escolha do tipo de imputação.
Neste exercício, o DataFrame diabetes_cc (o caso completo do conjunto de dados de diabetes) já foi carregado. O caso completo serve como base de comparação com outros DataFrames imputados. Você usará o pacote statsmodels.api, carregado como sm, para criar um modelo de regressão linear e gerar resumos.
Este exercício faz parte do curso
Lidando com Dados Ausentes em Python
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Add constant to X and set X & y values to fit linear model
X = sm.add_constant(___)
y = ___
lm = sm.OLS(y, X).fit()