ComenzarEmpieza gratis

Cálculo de la matriz de confusión

Una matriz de confusión (a veces denominada tabla de confusión) es la base de todas las métricas de rendimiento para modelos con una respuesta categórica (como una regresión logística). Contiene los recuentos de cada par de respuestas reales y respuestas previstas. En este caso, donde hay dos respuestas posibles (abandono o no abandono), hay cuatro resultados generales.

  1. El cliente se marchó y el modelo lo predijo.
  2. El cliente se marchó, pero el modelo no lo predijo.
  3. El cliente no se marchó, pero el modelo predijo que lo haría.
  4. El cliente no se marchó y el modelo lo predijo.

churn y mdl_churn_vs_relationship están disponibles.

Este ejercicio forma parte del curso

Introducción a la regresión en R

Ver curso

Instrucciones del ejercicio

  • Obtén las respuestas reales de la columna « has_churned » del conjunto de datos. Asigna a actual_response.
  • Obtén las respuestas «más probables» predichas por el modelo. Asigna a predicted_response.
  • Crea una tabla de recuentos a partir de los vectores de respuesta reales y previstos. Asigna a outcomes.

Ejercicio interactivo práctico

Prueba este ejercicio y completa el código de muestra.

# Get the actual responses from the dataset
actual_response <- ___

# Get the "most likely" responses from the model
predicted_response <- ___

# Create a table of counts
outcomes <- ___

# See the result
outcomes
Editar y ejecutar código