1. Nauka
  2. /
  3. Kursy
  4. /
  5. Uczenie maszynowe z modelami drzewiastymi w Pythonie

Connected

ćwiczenie

Oceń optymalne drzewo

W tym ćwiczeniu ocenisz wartość ROC AUC na zbiorze testowym dla optymalnego modelu grid_dt.

Aby to zrobić, najpierw wyznaczysz prawdopodobieństwo uzyskania etykiety pozytywnej dla każdej obserwacji ze zbioru testowego. Możesz skorzystać z metody predict_proba() klasyfikatora sklearn, która zwraca dwuwymiarową tablicę zawierającą prawdopodobieństwa klasy negatywnej i pozytywnej – odpowiednio w kolejnych kolumnach.

Zbiór danych jest już wczytany i przetworzony (cechy numeryczne zostały wystandaryzowane); jest podzielony na 80% danych treningowych i 20% testowych. W środowisku pracy dostępne są X_test oraz y_test. Dodatkowo wczytano wytrenowany obiekt GridSearchCV o nazwie grid_dt, który został utworzony w poprzednim ćwiczeniu. Zwróć uwagę, że grid_dt był trenowany w następujący sposób:

grid_dt.fit(X_train, y_train)

Instrukcje

100 XP
  • Zaimportuj roc_auc_score z sklearn.metrics.

  • Wyodrębnij atrybut .best_estimator_ z grid_dt i przypisz go do zmiennej best_model.

  • Przewidź prawdopodobieństwa uzyskania klasy pozytywnej na zbiorze testowym i zapisz je jako y_pred_proba.

  • Oblicz wartość ROC AUC na zbiorze testowym (test_roc_auc) dla modelu best_model.