Coeficientes en términos de odds
Antes ajustaste un modelo de regresión logística para la probabilidad de cambiar de pozo según los niveles de arsenic. En este ejercicio, verás cómo otra variable, distance100, se relaciona con la probabilidad de cambiar y cómo interpretar los coeficientes en términos de odds.
Recuerda que la regresión logística se expresa en términos de log-odds, así que, para saber en cuánto se multiplican las odds ante un aumento de una unidad en x, debes exponenciar las estimaciones de los coeficientes. A esto también se le llama odds ratio.
Recuerda que las odds son la razón entre que ocurra el evento y que no ocurra. Por ejemplo, si las odds de ganar un juego son 1/2 o 1 a 2 (1:2), significa que por cada victoria hay 2 derrotas.
El conjunto de datos wells está cargado en el espacio de trabajo.
Este ejercicio forma parte del curso
Modelos lineales generalizados en Python
Instrucciones del ejercicio
- Importa la librería
statsmodelsy la funciónglmdestatsmodels.formula.api. Importa tambiénnumpycomonp. - Usando
glm(), ajusta un modelo de regresión logística dondeswitchse prediga pordistance100. - Extrae los coeficientes del modelo usando
.params. - Calcula el efecto multiplicativo sobre las odds usando la función
exp()denumpy.
Ejercicio interactivo práctico
Prueba este ejercicio y completa el código de muestra.
# Load libraries and functions
import ____.api as sm
from ____.____.api import glm
import ____ as ____
# Fit logistic regression model
model_GLM = ____(formula = ____,
data = ____,
family = ____.____.____).____
# Extract model coefficients
print('Model coefficients: \n', ____.____)
# Compute the multiplicative effect on the odds
print('Odds: \n', np.____(____.____))