F1-score

Zoals je hebt gezien, is er een afruil tussen precision en recall. Beide zijn belangrijke metrieken, en afhankelijk van hoe het bedrijf churn wil modelleren, wil je de ene of de andere optimaliseren. Vaak willen stakeholders één enkele maat die de modelprestatie samenvat. De AUC is één zo’n metriek, en een andere is de F1-score, die als volgt wordt berekend:

2 * (precision * recall) / (precision + recall)

Het voordeel van de F1-score is dat deze zowel precision als recall in één metriek combineert. Een hoge F1-score is een teken van een goed presterend model, ook in situaties met onevenwichtige klassen. In scikit-learn kun je de F1-score berekenen met de functie f1_score.

Deze oefening maakt deel uit van de cursus

Marketinganalyse: klantverloop voorspellen in Python

Bekijk cursus

Oefeninstructies

Importeer f1_score uit sklearn.metrics.
Print de F1-score van het getrainde random forest.

Interactieve oefening met praktijkervaring

Probeer deze oefening door deze voorbeeldcode aan te vullen.

# Instantiate the classifier
clf = RandomForestClassifier()

# Fit to the training data
clf.fit(X_train, y_train)

# Predict the labels of the test set
y_pred = clf.predict(X_test)

# Import f1_score


# Print the F1 score
print(____)

Code bewerken en uitvoeren