Comparando valores previstos

No exercício anterior, você ajustou um modelo de regressão linear e um GLM (logístico) usando os dados crab, prevendo y com width. Em outras palavras, você quis prever a probabilidade de a fêmea ter um caranguejo satélite por perto dado o seu width.

Neste exercício, você vai analisar mais a fundo as probabilidades estimadas (a saída) dos dois modelos e tentar deduzir se o ajuste linear seria adequado para o problema em questão.

A prática usual é testar o modelo em dados novos, não vistos. Esse conjunto de dados é chamado de amostra de teste. A amostra test já foi criada para você e carregada no workspace. Note que você precisa de valores de teste para todas as variáveis presentes no modelo, que neste exemplo é width.

O conjunto de dados crab já foi pré-carregado no workspace.

Este exercicio faz parte do curso

Modelos Lineares Generalizados em Python

Ver curso

Instruções do exercicio

Use print() para visualizar o conjunto test.
Usando a amostra test, calcule as probabilidades estimadas com .predict() no modelo linear ajustado model_LM e salve como pred_lm. Também calcule as probabilidades estimadas com .predict() no GLM (logístico) ajustado salvo como model_GLM e salve como pred_glm.
Usando pandas DataFrame(), combine as previsões de ambos os modelos e salve como predictions.
Concatene test e predictions e salve como all_data. Visualize all_data usando print().

exercicio interativo prático

Tente este exercicio completando este código de exemplo.

# View test set
print(____)

# Compute estimated probabilities for linear model: pred_lm
____ = model_LM.____(____)

# Compute estimated probabilities for GLM model: pred_glm
____ = model_GLM.____(____)

# Create dataframe of predictions for linear and GLM model: predictions
____ = pd.DataFrame({'Pred_LM': ____, 'Pred_GLM': ____})

# Concatenate test sample and predictions and view the results
all_data = pd.concat([____, ____], axis = 1)
print(____)

Editar e Executar Código