Score F1
Comme vous l’avez vu, il existe un compromis entre la précision et le rappel. Ces deux métriques sont importantes et, selon la façon dont l’entreprise souhaite modéliser le churn, vous pouvez choisir d’optimiser l’une plutôt que l’autre. Souvent, les parties prenantes préfèrent disposer d’une métrique unique qui quantifie les performances du modèle. L’AUC en est une, et une autre est le score F1, calculé comme suit :
2 * (precision * recall) / (precision + recall)
L’avantage du score F1 est qu’il intègre à la fois la précision et le rappel en une seule mesure ; un score F1 élevé est le signe d’un modèle performant, même en présence de classes déséquilibrées. Avec scikit-learn, vous pouvez calculer le score F1 à l’aide de la fonction f1_score.
Cet exercice fait partie du cours
Marketing Analytics : prédire l’attrition client en Python
Instructions
- Importez
f1_scoredepuissklearn.metrics. - Affichez le score F1 de la forêt aléatoire entraînée.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Instantiate the classifier
clf = RandomForestClassifier()
# Fit to the training data
clf.fit(X_train, y_train)
# Predict the labels of the test set
y_pred = clf.predict(X_test)
# Import f1_score
# Print the F1 score
print(____)