ComeçarComece de graça

Explorar coeficientes do modelo

Agora você vai avaliar o desempenho do modelo por outro ângulo, e apenas nos dados de treino. Uma coisa que você aprendeu na última aula é que nem todos os coeficientes do modelo são estatisticamente significativos e devemos olhar a tabela de resumo do modelo para analisar sua significância. Felizmente, a biblioteca statsmodels oferece essa funcionalidade. Depois de imprimir a tabela de resumo do modelo, veja quais variáveis têm p-value menor que 0,05 (ou seja, menor que 5%) para garantir que o coeficiente é significativo.

As variáveis de treino estão carregadas como train_X, e a variável alvo como train_Y, que foi convertida para um array do numpy.

Este exercício faz parte do curso

Machine Learning para Marketing em Python

Ver curso

Instruções do exercício

  • Importe o módulo statsmodels.api.
  • Inicialize uma instância de modelo nos dados de treino usando a função OLS().
  • Ajuste o modelo.
  • Imprima o resumo do modelo usando o método .summary().

Exercício interativo prático

Experimente este exercício completando este código de exemplo.

# Import `statsmodels.api` module
import ___.___ as sm

# Initialize model instance on the training data
olsreg = sm.___(train_Y, train_X)

# Fit the model
olsreg = olsreg.___()

# Print model summary
print(olsreg.___())
Editar e executar o código