Puntuación F1

Como has visto, existe un equilibrio entre precisión y exhaustividad. Ambas son métricas importantes y, según cómo el negocio quiera modelar el churn, puede que te interese optimizar una u otra. A menudo, las personas interesadas en el proyecto prefieren una única métrica que cuantifique el rendimiento del modelo. El AUC es una opción y otra es la puntuación F1, que se calcula así:

2 * (precision * recall) / (precision + recall)

La ventaja de la F1 es que integra precisión y exhaustividad en una sola métrica, y una F1 alta indica que el modelo funciona bien, incluso cuando hay clases desbalanceadas. En scikit-learn, puedes calcular la F1 usando la función f1_score.

Este ejercicio forma parte del curso

Marketing Analytics: Predicción de churn de clientes en Python

Ver curso

Instrucciones del ejercicio

Importa f1_score de sklearn.metrics.
Imprime la puntuación F1 del random forest entrenado.

Ejercicio interactivo práctico

Prueba este ejercicio y completa el código de muestra.

# Instantiate the classifier
clf = RandomForestClassifier()

# Fit to the training data
clf.fit(X_train, y_train)

# Predict the labels of the test set
y_pred = clf.predict(X_test)

# Import f1_score


# Print the F1 score
print(____)

Editar y ejecutar código