Nauwkeurigheid berekenen

Nu je je data hebt opgesplitst in trainings- en testsets, kun je je model fitten op de training-data en daarna de labels van de test-data voorspellen. Dat ga je in deze oefening doen.

Tot nu toe heb je Logistic Regression en Decision Trees gebruikt. Hier gebruik je een RandomForestClassifier, die je kunt zien als een ensemble van Decision Trees dat over het algemeen beter presteert dan één enkele Decision Tree.

Je werk uit de vorige oefeningen is behouden, en de trainings- en testsets zijn beschikbaar in de variabelen X_train, X_test, y_train en y_test.

Deze oefening maakt deel uit van de cursus

Marketinganalyse: klantverloop voorspellen in Python

Bekijk cursus

Oefeninstructies

Importeer RandomForestClassifier uit sklearn.ensemble.
Maak een instantie van RandomForestClassifier als clf.
Fit clf op de trainingsdata: X_train en y_train.
Bereken de nauwkeurigheid van clf op de testdata met de .score()-methode.

Interactieve oefening met praktijkervaring

Probeer deze oefening door deze voorbeeldcode aan te vullen.

# Import RandomForestClassifier


# Instantiate the classifier
clf = ____

# Fit to the training data


# Compute accuracy
print(____.____(____, ____))

Code bewerken en uitvoeren