Puntuación F1
Como has visto, existe un equilibrio entre precisión y exhaustividad. Ambas son métricas importantes y, según cómo el negocio quiera modelar el churn, puede que te interese optimizar una u otra. A menudo, las personas interesadas en el proyecto prefieren una única métrica que cuantifique el rendimiento del modelo. El AUC es una opción y otra es la puntuación F1, que se calcula así:
2 * (precision * recall) / (precision + recall)
La ventaja de la F1 es que integra precisión y exhaustividad en una sola métrica, y una F1 alta indica que el modelo funciona bien, incluso cuando hay clases desbalanceadas. En scikit-learn, puedes calcular la F1 usando la función f1_score.
Este ejercicio forma parte del curso
Marketing Analytics: Predicción de churn de clientes en Python
Instrucciones del ejercicio
- Importa
f1_scoredesklearn.metrics. - Imprime la puntuación F1 del random forest entrenado.
Ejercicio interactivo práctico
Prueba este ejercicio y completa el código de muestra.
# Instantiate the classifier
clf = RandomForestClassifier()
# Fit to the training data
clf.fit(X_train, y_train)
# Predict the labels of the test set
y_pred = clf.predict(X_test)
# Import f1_score
# Print the F1 score
print(____)