ComenzarEmpieza gratis

Cálculo de la matriz de confusión

Una matriz de confusión (ocasionalmente llamada tabla de confusión) es la base de todas las métricas de rendimiento para modelos con una respuesta categórica (como una regresión logística). Contiene los recuentos de cada par respuesta real-respuesta prevista. En este caso, en el que hay dos respuestas posibles (cambiar o no cambiar), hay cuatro resultados globales.

  1. Verdadero positivo: El cliente abandonó y el modelo predijo que lo haría.
  2. Falso positivo: El cliente no abandonó, pero el modelo predijo que lo haría.
  3. Verdadero negativo: El cliente no abandonó y el modelo predijo que no lo haría.
  4. Falso negativo: El cliente abandonó, pero el modelo predijo que no lo haría.

churn y mdl_churn_vs_relationship están disponibles.

Este ejercicio forma parte del curso

Introducción a la regresión con modelos estadísticos en Python

Ver curso

Instrucciones de ejercicio

  • Obtenga las respuestas reales subconjuntando la columna has_churned del conjunto de datos. Asignar a actual_response.
  • Obtenga las respuestas previstas "más probables" del modelo. Asignar a predicted_response.
  • Crear un DataFrame a partir de actual_response y predicted_response. Asignar a outcomes.
  • Imprime outcomes como una tabla de recuentos, representando la matriz de confusión. Esto se ha hecho por ti.

Ejercicio interactivo práctico

Pruebe este ejercicio completando este código de muestra.

# Get the actual responses
actual_response = ____

# Get the predicted responses
predicted_response = ____

# Create outcomes as a DataFrame of both Series
outcomes = pd.DataFrame({____,
                         ____})

# Print the outcomes
print(outcomes.value_counts(sort = False))
Editar y ejecutar código