Calcular previsões
Com frequência, na prática, queremos usar a regressão logística ajustada para estimar probabilidades e construir intervalos de confiança para essas estimativas. Usando o conjunto de dados wells e o modelo 'switch ~ arsenic', vamos supor que você tem novas observações wells_test que não fizeram parte da amostra de treino e deseja prever a probabilidade de mudar para o poço seguro mais próximo.
Você fará isso com a ajuda do método .predict().
Observe que .predict() recebe vários argumentos:
exog- novas observações (conjunto de teste)transform = True- passa a fórmula do ajustey ~ xpara os dados.
Se exog não for definido, as probabilidades são calculadas para o conjunto de treino.
O modelo wells_fit e os conjuntos de dados wells e wells_test já estão carregados no workspace.
Este exercício faz parte do curso
Modelos Lineares Generalizados em Python
Instruções do exercício
- Usando o modelo ajustado
wells_fit, calcule a previsão nos dados de testewells_teste salve comoprediction. - Adicione
predictionao dataframe existentewells_teste nomeie a coluna comoprediction. - Usando
print(), mostre as 5 primeiras linhas dewells_testcom as colunasswitch,arseniceprediction. Use a funçãohead()do pandas para ver apenas as 5 primeiras linhas.
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Compute predictions for the test sample wells_test and save as prediction
prediction = ____.predict(exog = ____)
# Add prediction to the existing data frame wells_test and assign column name prediction
____[____] = ____
# Examine the first 5 computed predictions
print(____[[____, ____, ____]].head())