IniziaInizia gratis

Soglia predefinita

Vuoi verificare che DecisionTreeClassifier() usi la stessa soglia di classificazione predefinita menzionata nella lezione precedente, ovvero 0,5. Ti sembra strano che tutti i classificatori usino la stessa soglia. Controlliamo! Un classificatore ad albero decisionale già addestrato clf è stato caricato per te, così come i dati di train e test con i loro nomi abituali: X_train, X_test, y_train e y_test. Dovrai estrarre le probabilità dal classificatore usando il metodo .predict_proba().

Questo esercizio fa parte del corso

Progettare workflow di Machine Learning in Python

Visualizza il corso

Istruzioni dell'esercizio

  • Calcola gli score per gli esempi di test usando il classificatore clf già caricato.
  • Ora estrai le etichette dagli score. Ricorda che hai una coppia di score per ogni esempio, non uno solo, e il secondo elemento è la probabilità della classe positiva.
  • Ora etichetta i dati di test usando il metodo standard .predict()
  • Infine, confronta con le predizioni ottenute prima. Sono identiche?

Esercizio pratico interattivo

Prova a risolvere questo esercizio completando il codice di esempio.

# Score the test data using the given classifier
scores = clf.____(____)

# Get labels from the scores using the default threshold
preds = [s[____] > ____ for s in scores]

# Use the predict method to label the test data again
preds_default = clf.____(____)

# Compare the two sets of predictions
____(preds == preds_default)
Modifica ed esegui il codice