1. Nauka
  2. /
  3. Kursy
  4. /
  5. Nadzorowane uczenie maszynowe z scikit-learn

Connected

ćwiczenie

Strojenie hiperparametrów za pomocą RandomizedSearchCV

Jak już wiesz, GridSearchCV może być obliczeniowo kosztowny – szczególnie gdy przeszukujesz duży obszar hiperparametrów. W takim przypadku warto użyć RandomizedSearchCV, który sprawdza ustaloną liczbę kombinacji hiperparametrów losowanych z określonych rozkładów prawdopodobieństwa.

Zbiory treningowy i testowy z diabetes_df zostały wcześniej załadowane jako X_train, X_test, y_train i y_test, gdzie zmienną docelową jest "diabetes". Model regresji logistycznej został utworzony i zapisany jako logreg, a zmienna KFold – jako kf.

Zdefiniujesz zakres hiperparametrów i użyjesz RandomizedSearchCV – zaimportowanego z sklearn.model_selection – aby znaleźć optymalne hiperparametry spośród dostępnych opcji.

Instrukcje

100 XP
  • Utwórz params, dodając "l1" i "l2" jako wartości penalty, ustawiając C na zakres 50 wartości zmiennoprzecinkowych między 0.1 a 1.0, a class_weight na "balanced" lub słownik zawierający 0:0.8, 1:0.2.
  • Utwórz obiekt Randomized Search CV, przekazując model i parametry oraz ustawiając cv równe kf.
  • Dopasuj logreg_cv do danych treningowych.
  • Wyświetl najlepsze parametry modelu i jego dokładność.