Valuta l’albero ottimale
In questo esercizio valuterai l’AUC ROC sul test set del modello ottimale di grid_dt.
Per farlo, prima determinerai la probabilità di ottenere l’etichetta positiva per ciascuna osservazione del test set. Puoi usare il metodo predict_proba() di un classificatore di scikit-learn per calcolare un array 2D che contiene, rispettivamente per colonne, le probabilità delle etichette di classe negativa e positiva.
Il dataset è già caricato e preprocessato per te (le caratteristiche numeriche sono standardizzate); è suddiviso in 80% train e 20% test. X_test, y_test sono disponibili nel tuo workspace. Inoltre, abbiamo già caricato l’oggetto GridSearchCV addestrato grid_dt che hai istanziato nell’esercizio precedente. Nota che grid_dt è stato addestrato come segue:
grid_dt.fit(X_train, y_train)
Questo esercizio fa parte del corso
Machine Learning con modelli ad alberi in Python
Istruzioni dell'esercizio
Importa
roc_auc_scoredasklearn.metrics.Estrai l’attributo
.best_estimator_dagrid_dte assegnalo abest_model.Predici le probabilità del test set di ottenere la classe positiva in
y_pred_proba.Calcola l’AUC ROC sul test set
test_roc_aucdibest_model.
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
# Import roc_auc_score from sklearn.metrics
____
# Extract the best estimator
best_model = ____
# Predict the test set probabilities of the positive class
y_pred_proba = ____
# Compute test_roc_auc
test_roc_auc = ____
# Print test_roc_auc
print('Test set ROC AUC score: {:.3f}'.format(test_roc_auc))