Explorar coeficientes do modelo
Agora você vai avaliar o desempenho do modelo por outro ângulo, e apenas nos dados de treino. Uma coisa que você aprendeu na última aula é que nem todos os coeficientes do modelo são estatisticamente significativos e devemos olhar a tabela de resumo do modelo para analisar sua significância. Felizmente, a biblioteca statsmodels oferece essa funcionalidade. Depois de imprimir a tabela de resumo do modelo, veja quais variáveis têm p-value menor que 0,05 (ou seja, menor que 5%) para garantir que o coeficiente é significativo.
As variáveis de treino estão carregadas como train_X, e a variável alvo como train_Y, que foi convertida para um array do numpy.
Este exercício faz parte do curso
Machine Learning para Marketing em Python
Instruções do exercício
- Importe o módulo
statsmodels.api. - Inicialize uma instância de modelo nos dados de treino usando a função
OLS(). - Ajuste o modelo.
- Imprima o resumo do modelo usando o método
.summary().
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Import `statsmodels.api` module
import ___.___ as sm
# Initialize model instance on the training data
olsreg = sm.___(train_Y, train_X)
# Fit the model
olsreg = olsreg.___()
# Print model summary
print(olsreg.___())