Score F1

Comme vous l’avez vu, il existe un compromis entre la précision et le rappel. Ces deux métriques sont importantes et, selon la façon dont l’entreprise souhaite modéliser le churn, vous pouvez choisir d’optimiser l’une plutôt que l’autre. Souvent, les parties prenantes préfèrent disposer d’une métrique unique qui quantifie les performances du modèle. L’AUC en est une, et une autre est le score F1, calculé comme suit :

2 * (precision * recall) / (precision + recall)

L’avantage du score F1 est qu’il intègre à la fois la précision et le rappel en une seule mesure ; un score F1 élevé est le signe d’un modèle performant, même en présence de classes déséquilibrées. Avec scikit-learn, vous pouvez calculer le score F1 à l’aide de la fonction f1_score.

Cet exercice fait partie du cours

<cours>Marketing Analytics : prédire l’attrition client en Python</cours>

Voir le cours

Instructions de l’exercice

Importez f1_score depuis sklearn.metrics.
Affichez le score F1 de la forêt aléatoire entraînée.

Exercice interactif pratique

Essayez cet exercice en complétant ce code d’exemple.

# Instantiate the classifier
clf = RandomForestClassifier()

# Fit to the training data
clf.fit(X_train, y_train)

# Predict the labels of the test set
y_pred = clf.predict(X_test)

# Import f1_score


# Print the F1 score
print(____)

Modifier et exécuter le code