IniziaInizia gratis

Valuta l’albero ottimale

In questo esercizio valuterai l’AUC ROC sul test set del modello ottimale di grid_dt.

Per farlo, prima determinerai la probabilità di ottenere l’etichetta positiva per ciascuna osservazione del test set. Puoi usare il metodo predict_proba() di un classificatore di scikit-learn per calcolare un array 2D che contiene, rispettivamente per colonne, le probabilità delle etichette di classe negativa e positiva.

Il dataset è già caricato e preprocessato per te (le caratteristiche numeriche sono standardizzate); è suddiviso in 80% train e 20% test. X_test, y_test sono disponibili nel tuo workspace. Inoltre, abbiamo già caricato l’oggetto GridSearchCV addestrato grid_dt che hai istanziato nell’esercizio precedente. Nota che grid_dt è stato addestrato come segue:

grid_dt.fit(X_train, y_train)

Questo esercizio fa parte del corso

Machine Learning con modelli ad alberi in Python

Visualizza il corso

Istruzioni dell'esercizio

  • Importa roc_auc_score da sklearn.metrics.

  • Estrai l’attributo .best_estimator_ da grid_dt e assegnalo a best_model.

  • Predici le probabilità del test set di ottenere la classe positiva in y_pred_proba.

  • Calcola l’AUC ROC sul test set test_roc_auc di best_model.

Esercizio pratico interattivo

Prova a risolvere questo esercizio completando il codice di esempio.

# Import roc_auc_score from sklearn.metrics
____

# Extract the best estimator
best_model = ____

# Predict the test set probabilities of the positive class
y_pred_proba = ____

# Compute test_roc_auc
test_roc_auc = ____

# Print test_roc_auc
print('Test set ROC AUC score: {:.3f}'.format(test_roc_auc))
Modifica ed esegui il codice