Cálculo de la matriz de confusión
Una matriz de confusión (ocasionalmente llamada tabla de confusión) es la base de todas las métricas de rendimiento para modelos con una respuesta categórica (como una regresión logística). Contiene los recuentos de cada par respuesta real-respuesta prevista. En este caso, en el que hay dos respuestas posibles (cambiar o no cambiar), hay cuatro resultados globales.
- Verdadero positivo: El cliente abandonó y el modelo predijo que lo haría.
- Falso positivo: El cliente no abandonó, pero el modelo predijo que lo haría.
- Verdadero negativo: El cliente no abandonó y el modelo predijo que no lo haría.
- Falso negativo: El cliente abandonó, pero el modelo predijo que no lo haría.
churn
y mdl_churn_vs_relationship
están disponibles.
Este ejercicio forma parte del curso
Introducción a la regresión con modelos estadísticos en Python
Instrucciones de ejercicio
- Obtenga las respuestas reales subconjuntando la columna
has_churned
del conjunto de datos. Asignar aactual_response
. - Obtenga las respuestas previstas "más probables" del modelo. Asignar a
predicted_response
. - Crear un DataFrame a partir de
actual_response
ypredicted_response
. Asignar aoutcomes
. - Imprime
outcomes
como una tabla de recuentos, representando la matriz de confusión. Esto se ha hecho por ti.
Ejercicio interactivo práctico
Pruebe este ejercicio completando este código de muestra.
# Get the actual responses
actual_response = ____
# Get the predicted responses
predicted_response = ____
# Create outcomes as a DataFrame of both Series
outcomes = pd.DataFrame({____,
____})
# Print the outcomes
print(outcomes.value_counts(sort = False))