Calcular predicciones
A menudo, en la práctica, nos interesa usar la regresión logística ajustada para estimar probabilidades y construir intervalos de confianza para esas estimaciones. Usando el conjunto de datos wells y el modelo 'switch ~ arsenic', supón que tienes nuevas observaciones wells_test que no formaron parte de la muestra de entrenamiento y quieres predecir la probabilidad de cambiar al pozo seguro más cercano.
Harás esto con la ayuda del método .predict().
Ten en cuenta que .predict() acepta varios argumentos:
exog- nuevas observaciones (conjunto de datos de prueba)transform = True- aplica la fórmula del ajustey ~ xa los datos.
Si no se define exog, las probabilidades se calculan para el conjunto de entrenamiento.
El modelo wells_fit y los conjuntos de datos wells y wells_test están precargados en el espacio de trabajo.
Este ejercicio forma parte del curso
Modelos lineales generalizados en Python
Instrucciones del ejercicio
- Usando el modelo ajustado
wells_fit, calcula la predicción sobre los datos de pruebawells_testy guárdala comoprediction. - Añade
predictional dataframe existentewells_testy nombra la columnaprediction. - Usando
print(), muestra las primeras 5 filas dewells_testcon las columnasswitch,arsenicyprediction. Usa la funciónhead()de pandas para ver solo las primeras 5 filas.
Ejercicio interactivo práctico
Prueba este ejercicio y completa el código de muestra.
# Compute predictions for the test sample wells_test and save as prediction
prediction = ____.predict(exog = ____)
# Add prediction to the existing data frame wells_test and assign column name prediction
____[____] = ____
# Examine the first 5 computed predictions
print(____[[____, ____, ____]].head())