Nauwkeurigheid berekenen
Nu je je data hebt opgesplitst in trainings- en testsets, kun je je model fitten op de training-data en daarna de labels van de test-data voorspellen. Dat ga je in deze oefening doen.
Tot nu toe heb je Logistic Regression en Decision Trees gebruikt. Hier gebruik je een RandomForestClassifier, die je kunt zien als een ensemble van Decision Trees dat over het algemeen beter presteert dan één enkele Decision Tree.
Je werk uit de vorige oefeningen is behouden, en de trainings- en testsets zijn beschikbaar in de variabelen X_train, X_test, y_train en y_test.
Deze oefening maakt deel uit van de cursus
Marketinganalyse: klantverloop voorspellen in Python
Oefeninstructies
- Importeer
RandomForestClassifieruitsklearn.ensemble. - Maak een instantie van
RandomForestClassifieralsclf. - Fit
clfop de trainingsdata:X_traineny_train. - Bereken de nauwkeurigheid van
clfop de testdata met de.score()-methode.
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Import RandomForestClassifier
# Instantiate the classifier
clf = ____
# Fit to the training data
# Compute accuracy
print(____.____(____, ____))