F1-score
Zoals je hebt gezien, is er een afruil tussen precision en recall. Beide zijn belangrijke metrieken, en afhankelijk van hoe het bedrijf churn wil modelleren, wil je de ene of de andere optimaliseren. Vaak willen stakeholders één enkele maat die de modelprestatie samenvat. De AUC is één zo’n metriek, en een andere is de F1-score, die als volgt wordt berekend:
2 * (precision * recall) / (precision + recall)
Het voordeel van de F1-score is dat deze zowel precision als recall in één metriek combineert. Een hoge F1-score is een teken van een goed presterend model, ook in situaties met onevenwichtige klassen. In scikit-learn kun je de F1-score berekenen met de functie f1_score.
Deze oefening maakt deel uit van de cursus
Marketinganalyse: klantverloop voorspellen in Python
Oefeninstructies
- Importeer
f1_scoreuitsklearn.metrics. - Print de F1-score van het getrainde random forest.
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Instantiate the classifier
clf = RandomForestClassifier()
# Fit to the training data
clf.fit(X_train, y_train)
# Predict the labels of the test set
y_pred = clf.predict(X_test)
# Import f1_score
# Print the F1 score
print(____)