Het beste model kiezen
In deze oefening vergelijk je verschillende classificatiemodellen en kies je het model dat het beste presteert.
De gegevensset hier — al geladen en opgesplitst in train- en testsets — bestaat uit Pokémon: hun stats, types en of ze wel of niet legendarisch zijn. Het doel van onze classifiers is om de variabele 'Legendary' te voorspellen.
Er zijn drie afzonderlijke classifiers getraind op de trainingsset:
clf_lris een logistische regressie.clf_dtis een beslisboom.clf_knnis een 5-nearest neighbors-classifier.
Omdat de klassen hier uit balans zijn — slechts 65 van de 800 Pokémon in de gegevensset zijn legendarisch — gebruiken we de F1-score om de prestaties te evalueren. Scikit-learn's f1_score() is alvast voor je geïmporteerd.
Deze oefening maakt deel uit van de cursus
Ensemblemethoden in Python
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Predict the labels of the test set
pred_lr = ____
pred_dt = ____
pred_knn = ____