Probabilidad y log-verosimilitud
La regresión lineal intenta optimizar una métrica de "suma de cuadrados" para encontrar el mejor ajuste. Esa métrica no es aplicable a la regresión logística. En cambio, la regresión logística intenta optimizar una métrica llamada verosimilitud, o una métrica relacionada llamada log-verosimilitud.
El cuadro de mandos muestra el estado del churn frente al tiempo transcurrido desde la última compra del conjunto de datos churn
. La línea punteada azul es la línea de predicción de regresión logística calculada mediante geom_smooth()
de ggplot2. (Es decir, es la línea de "mejor ajuste"). La línea sólida negra muestra una línea de predicción calculada a partir de los coeficientes de intercepción y pendiente que especifiques como plogis(intercept + slope * time_since_last_purchase)
.
Cambia los coeficientes de intercepción y pendiente y observa cómo cambian los valores de probabilidad y log-verosimilitud.
A medida que te acercas a la línea de mejor ajuste, ¿qué afirmación es cierta sobre la verosimilitud y la log-verosimilitud?
Este ejercicio forma parte del curso
Regresión intermedia en R
Ejercicio interactivo práctico
Convierte la teoría en acción con uno de nuestros ejercicios interactivos
