Calcular predicciones

A menudo, en la práctica, nos interesa usar la regresión logística ajustada para estimar probabilidades y construir intervalos de confianza para esas estimaciones. Usando el conjunto de datos wells y el modelo 'switch ~ arsenic', supón que tienes nuevas observaciones wells_test que no formaron parte de la muestra de entrenamiento y quieres predecir la probabilidad de cambiar al pozo seguro más cercano.

Harás esto con la ayuda del método .predict().

Ten en cuenta que .predict() acepta varios argumentos:

exog - nuevas observaciones (conjunto de datos de prueba)
transform = True - aplica la fórmula del ajuste y ~ x a los datos.

Si no se define exog, las probabilidades se calculan para el conjunto de entrenamiento.

El modelo wells_fit y los conjuntos de datos wells y wells_test están precargados en el espacio de trabajo.

Este ejercicio forma parte del curso

Modelos lineales generalizados en Python

Ver curso

Instrucciones del ejercicio

Usando el modelo ajustado wells_fit, calcula la predicción sobre los datos de prueba wells_test y guárdala como prediction.
Añade prediction al dataframe existente wells_test y nombra la columna prediction.
Usando print(), muestra las primeras 5 filas de wells_test con las columnas switch, arsenic y prediction. Usa la función head() de pandas para ver solo las primeras 5 filas.

ejercicio interactivo práctico

Prueba este ejercicio completando este código de ejemplo.

# Compute predictions for the test sample wells_test and save as prediction
prediction = ____.predict(exog = ____)

# Add prediction to the existing data frame wells_test and assign column name prediction
____[____] = ____

# Examine the first 5 computed predictions
print(____[[____, ____, ____]].head())

Editar y ejecutar código