Soglia predefinita
Vuoi verificare che DecisionTreeClassifier() usi la stessa soglia di classificazione predefinita menzionata nella lezione precedente, ovvero 0,5. Ti sembra strano che tutti i classificatori usino la stessa soglia. Controlliamo! Un classificatore ad albero decisionale già addestrato clf è stato caricato per te, così come i dati di train e test con i loro nomi abituali: X_train, X_test, y_train e y_test. Dovrai estrarre le probabilità dal classificatore usando il metodo .predict_proba().
Questo esercizio fa parte del corso
Progettare workflow di Machine Learning in Python
Istruzioni dell'esercizio
- Calcola gli score per gli esempi di test usando il classificatore
clfgià caricato. - Ora estrai le etichette dagli score. Ricorda che hai una coppia di score per ogni esempio, non uno solo, e il secondo elemento è la probabilità della classe positiva.
- Ora etichetta i dati di test usando il metodo standard
.predict() - Infine, confronta con le predizioni ottenute prima. Sono identiche?
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
# Score the test data using the given classifier
scores = clf.____(____)
# Get labels from the scores using the default threshold
preds = [s[____] > ____ for s in scores]
# Use the predict method to label the test data again
preds_default = clf.____(____)
# Compare the two sets of predictions
____(preds == preds_default)