Strojenie hiperparametrów za pomocą RandomizedSearchCV

Jak już wiesz, GridSearchCV może być obliczeniowo kosztowny – szczególnie gdy przeszukujesz duży obszar hiperparametrów. W takim przypadku warto użyć RandomizedSearchCV, który sprawdza ustaloną liczbę kombinacji hiperparametrów losowanych z określonych rozkładów prawdopodobieństwa.

Zbiory treningowy i testowy z diabetes_df zostały wcześniej załadowane jako X_train, X_test, y_train i y_test, gdzie zmienną docelową jest "diabetes". Model regresji logistycznej został utworzony i zapisany jako logreg, a zmienna KFold – jako kf.

Zdefiniujesz zakres hiperparametrów i użyjesz RandomizedSearchCV – zaimportowanego z sklearn.model_selection – aby znaleźć optymalne hiperparametry spośród dostępnych opcji.

Utwórz params, dodając "l1" i "l2" jako wartości penalty, ustawiając C na zakres 50 wartości zmiennoprzecinkowych między 0.1 a 1.0, a class_weight na "balanced" lub słownik zawierający 0:0.8, 1:0.2.
Utwórz obiekt Randomized Search CV, przekazując model i parametry oraz ustawiając cv równe kf.
Dopasuj logreg_cv do danych treningowych.
Wyświetl najlepsze parametry modelu i jego dokładność.

ćwiczenie

Strojenie hiperparametrów za pomocą RandomizedSearchCV

Instrukcje

.css-6su6fj{-webkit-flex-shrink:0;-ms-flex-negative:0;flex-shrink:0;}ćwiczenie

Instrukcje

ćwiczenie