1. Learn
  2. /
  3. Cursuri
  4. /
  5. Machine Learning cu modele bazate pe arbori în Python

Connected

exercițiu

Evaluează arborele optim

În acest exercițiu, vei evalua scorul ROC AUC pe setul de testare al modelului optim din grid_dt.

Pentru a face acest lucru, vei determina mai întâi probabilitatea de a obține eticheta pozitivă pentru fiecare observație din setul de testare. Poți folosi metoda predict_proba() a unui clasificator sklearn pentru a calcula un array 2D care conține probabilitățile etichetelor clasei negative și, respectiv, pozitive, de-a lungul coloanelor.

Setul de date este deja încărcat și procesat (caracteristicile numerice sunt standardizate); acesta este împărțit în 80% antrenament și 20% testare. X_test, y_test sunt disponibile în spațiul tău de lucru. În plus, am încărcat și obiectul GridSearchCV antrenat grid_dt, pe care l-ai inițializat în exercițiul anterior. Reține că grid_dt a fost antrenat astfel:

grid_dt.fit(X_train, y_train)

Instrucțiuni

100 XP
  • Importă roc_auc_score din sklearn.metrics.

  • Extrage atributul .best_estimator_ din grid_dt și atribuie-l variabilei best_model.

  • Prezice probabilitățile din setul de testare pentru obținerea clasei pozitive y_pred_proba.

  • Calculează scorul ROC AUC pe setul de testare test_roc_auc al modelului best_model.