Aan de slagGa gratis aan de slag

Het beste model kiezen

In deze oefening vergelijk je verschillende classificatiemodellen en kies je het model dat het beste presteert.

De gegevensset hier — al geladen en opgesplitst in train- en testsets — bestaat uit Pokémon: hun stats, types en of ze wel of niet legendarisch zijn. Het doel van onze classifiers is om de variabele 'Legendary' te voorspellen.

Er zijn drie afzonderlijke classifiers getraind op de trainingsset:

  • clf_lr is een logistische regressie.
  • clf_dt is een beslisboom.
  • clf_knn is een 5-nearest neighbors-classifier.

Omdat de klassen hier uit balans zijn — slechts 65 van de 800 Pokémon in de gegevensset zijn legendarisch — gebruiken we de F1-score om de prestaties te evalueren. Scikit-learn's f1_score() is alvast voor je geïmporteerd.

Deze oefening maakt deel uit van de cursus

Ensemblemethoden in Python

Cursus bekijken

Praktische interactieve oefening

Probeer deze oefening eens door deze voorbeeldcode in te vullen.

# Predict the labels of the test set
pred_lr = ____
pred_dt = ____
pred_knn = ____
Code bewerken en uitvoeren