1. Learn
  2. /
  3. Kurser
  4. /
  5. Przewidywanie CTR z użyciem uczenia maszynowego w Pythonie

Connected

övning

Przeszukiwanie siatki

Dostrajanie hiperparametrów można przeprowadzić za pomocą sklearn, podając różne wartości parametrów wejściowych – każdy z nich można zakodować przy użyciu funkcji z biblioteki numpy. Jedną z metod dostrajania jest przeszukiwanie siatki (ang. grid search), które sprawdza wszystkie kombinacje hiperparametrów określonych w param_grid. W tym ćwiczeniu użyjesz przeszukiwania siatki do zbadania hiperparametrów przykładowego klasyfikatora lasu losowego, stosując jako funkcję oceny AUC krzywej ROC.

W przestrzeni roboczej dostępne są: X_train, y_train, X_test, y_test. Zaimportowane są również: pandas jako pd, numpy jako np oraz sklearn. Dodatkowo dostępna jest funkcja GridSearchCV() z modułu sklearn.model_selection.

Instruktioner

100 XP
  • Utwórz listy wartości dla każdego hiperparametru: n_estimators i max_depth.
  • Utwórz klasyfikator lasu losowego.
  • Skonfiguruj przeszukiwanie siatki, aby przejść przez wszystkie kombinacje hiperparametrów.
  • Wypisz najlepszy wynik AUC za pomocą .best_score_ oraz najlepszy estymator, który go osiągnął, za pomocą .best_estimator_.