ComeçarComece de graça

Calcular previsões

Com frequência, na prática, queremos usar a regressão logística ajustada para estimar probabilidades e construir intervalos de confiança para essas estimativas. Usando o conjunto de dados wells e o modelo 'switch ~ arsenic', vamos supor que você tem novas observações wells_test que não fizeram parte da amostra de treino e deseja prever a probabilidade de mudar para o poço seguro mais próximo.

Você fará isso com a ajuda do método .predict().

Observe que .predict() recebe vários argumentos:

  • exog - novas observações (conjunto de teste)
  • transform = True - passa a fórmula do ajuste y ~ x para os dados.

Se exog não for definido, as probabilidades são calculadas para o conjunto de treino.

O modelo wells_fit e os conjuntos de dados wells e wells_test já estão carregados no workspace.

Este exercício faz parte do curso

Modelos Lineares Generalizados em Python

Ver curso

Instruções do exercício

  • Usando o modelo ajustado wells_fit, calcule a previsão nos dados de teste wells_test e salve como prediction.
  • Adicione prediction ao dataframe existente wells_test e nomeie a coluna como prediction.
  • Usando print(), mostre as 5 primeiras linhas de wells_test com as colunas switch, arsenic e prediction. Use a função head() do pandas para ver apenas as 5 primeiras linhas.

Exercício interativo prático

Experimente este exercício completando este código de exemplo.

# Compute predictions for the test sample wells_test and save as prediction
prediction = ____.predict(exog = ____)

# Add prediction to the existing data frame wells_test and assign column name prediction
____[____] = ____

# Examine the first 5 computed predictions
print(____[[____, ____, ____]].head())
Editar e executar o código