1. Učit se
  2. /
  3. Kurzy
  4. /
  5. Machine Learning with Tree-Based Models in Python

Connected

cvičení

Vyhodnocení optimálního stromu

V tomto cvičení vyhodnotíš skóre ROC AUC na testovací sadě pro optimální model grid_dt.

Nejprve určíš pravděpodobnost, s jakou každé pozorování z testovací sady dostane kladný štítek. K tomu slouží metoda predict_proba() klasifikátoru ze scikit-learn, která vrací 2D pole obsahující pravděpodobnosti záporné a kladné třídy v jednotlivých sloupcích.

Dataset je už načtený a připravený (numerické příznaky jsou standardizované) a rozdělený na 80 % trénovacích a 20 % testovacích dat. V pracovním prostředí máš k dispozici X_test a y_test. Kromě toho je načtený i natrénovaný objekt GridSearchCV s názvem grid_dt, který jsi vytvořil/a v předchozím cvičení. Objekt grid_dt byl natrénován takto:

grid_dt.fit(X_train, y_train)

Pokyny

100 XP
  • Importuj roc_auc_score z sklearn.metrics.

  • Vyextrahuj atribut .best_estimator_ z objektu grid_dt a přiřaď ho do proměnné best_model.

  • Predikuj pravděpodobnosti testovací sady pro získání kladné třídy – výsledek ulož do y_pred_proba.

  • Vypočítej skóre ROC AUC testovací sady test_roc_auc pro best_model.