Comparando valores previstos
No exercício anterior, você ajustou um modelo de regressão linear e um GLM (logístico) usando os dados crab, prevendo y com width. Em outras palavras, você quis prever a probabilidade de a fêmea ter um caranguejo satélite por perto dado o seu width.
Neste exercício, você vai analisar mais a fundo as probabilidades estimadas (a saída) dos dois modelos e tentar deduzir se o ajuste linear seria adequado para o problema em questão.
A prática usual é testar o modelo em dados novos, não vistos. Esse conjunto de dados é chamado de amostra de teste.
A amostra test já foi criada para você e carregada no workspace. Note que você precisa de valores de teste para todas as variáveis presentes no modelo, que neste exemplo é width.
O conjunto de dados crab já foi pré-carregado no workspace.
Este exercício faz parte do curso
Modelos Lineares Generalizados em Python
Instruções do exercício
- Use
print()para visualizar o conjuntotest. - Usando a amostra
test, calcule as probabilidades estimadas com.predict()no modelo linear ajustadomodel_LMe salve comopred_lm. Também calcule as probabilidades estimadas com.predict()no GLM (logístico) ajustado salvo comomodel_GLMe salve comopred_glm. - Usando
pandasDataFrame(), combine as previsões de ambos os modelos e salve comopredictions. - Concatene
testepredictionse salve comoall_data. Visualizeall_datausandoprint().
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# View test set
print(____)
# Compute estimated probabilities for linear model: pred_lm
____ = model_LM.____(____)
# Compute estimated probabilities for GLM model: pred_glm
____ = model_GLM.____(____)
# Create dataframe of predictions for linear and GLM model: predictions
____ = pd.DataFrame({'Pred_LM': ____, 'Pred_GLM': ____})
# Concatenate test sample and predictions and view the results
all_data = pd.concat([____, ____], axis = 1)
print(____)