Cálculo de la matriz de confusión
Una matriz de confusión (a veces denominada tabla de confusión) es la base de todas las métricas de rendimiento para modelos con una respuesta categórica (como una regresión logística). Contiene los recuentos de cada par de respuestas reales y respuestas previstas. En este caso, donde hay dos respuestas posibles (abandono o no abandono), hay cuatro resultados generales.
- El cliente se marchó y el modelo lo predijo.
- El cliente se marchó, pero el modelo no lo predijo.
- El cliente no se marchó, pero el modelo predijo que lo haría.
- El cliente no se marchó y el modelo lo predijo.
churn y mdl_churn_vs_relationship están disponibles.
Este ejercicio forma parte del curso
Introducción a la regresión en R
Instrucciones del ejercicio
- Obtén las respuestas reales de la columna «
has_churned» del conjunto de datos. Asigna aactual_response. - Obtén las respuestas «más probables» predichas por el modelo. Asigna a
predicted_response. - Crea una tabla de recuentos a partir de los vectores de respuesta reales y previstos. Asigna a
outcomes.
Ejercicio interactivo práctico
Prueba este ejercicio y completa el código de muestra.
# Get the actual responses from the dataset
actual_response <- ___
# Get the "most likely" responses from the model
predicted_response <- ___
# Create a table of counts
outcomes <- ___
# See the result
outcomes