Aan de slagGa gratis aan de slag

Standaard drempelwaarde

Je wilt bevestigen dat DecisionTreeClassifier() dezelfde standaardclassificatiedrempel gebruikt als in de vorige les, namelijk 0,5. Het lijkt je vreemd dat alle classifiers dezelfde drempel zouden gebruiken. Laten we het checken! Een getrainde decision tree-classifier clf is al voor je geladen, net als de train- en testgegevens met hun gebruikelijke namen: X_train, X_test, y_train en y_test. Je moet waarschijnlijkheden uit de classifier halen met de .predict_proba()-methode.

Deze oefening maakt deel uit van de cursus

Machine Learning-workflows ontwerpen in Python

Cursus bekijken

Oefeninstructies

  • Maak scores voor de testvoorbeelden met de vooraf geladen classifier clf.
  • Haal nu labels uit de scores. Denk eraan dat je voor elk voorbeeld een paar scores hebt, niet één enkele score, en dat het tweede element de kans is op de positieve klasse.
  • Label nu de testdata met de standaardmethode .predict()
  • Vergelijk tot slot met de voorspellingen die je eerder kreeg. Zijn ze identiek?

Praktische interactieve oefening

Probeer deze oefening eens door deze voorbeeldcode in te vullen.

# Score the test data using the given classifier
scores = clf.____(____)

# Get labels from the scores using the default threshold
preds = [s[____] > ____ for s in scores]

# Use the predict method to label the test data again
preds_default = clf.____(____)

# Compare the two sets of predictions
____(preds == preds_default)
Code bewerken en uitvoeren