Hyperparameter-Tuning mit RandomizedSearchCV

Wie du gesehen hast, kann GridSearchCV sehr rechenintensiv sein, vor allem wenn du in einem großen Hyperparameterraum suchst. In diesem Fall kannst du RandomizedSearchCV verwenden, das eine feste Anzahl von Hyperparameter-Einstellungen aus vorgegebenen Wahrscheinlichkeitsverteilungen testet.

Die Trainings- und Testmengen von diabetes_df wurden für dich als X_train, X_test, y_train und y_test vorgeladen, wobei das Ziel "diabetes" ist. Es wurde ein logistisches Regressionsmodell erstellt und als logreg gespeichert, ebenso wie eine KFold-Variable, die als kf gespeichert wurde.

Du legst eine Reihe von Hyperparametern fest und verwendest RandomizedSearchCV (importiert von sklearn.model_selection), um nach optimalen Hyperparametern in diesen Optionen zu suchen.

Erstelle params, füge "l1" und "l2" als penalty-Werte hinzu, setze C auf einen Bereich von 50 Gleitkommawerten zwischen 0.1 und 1.0 und setze class_weight entweder auf "balanced" oder ein Dictionary mit 0:0.8, 1:0.2.
Erstelle das RandomizedSearchCV-Objekt, übergebe das Modell und die Parameter und setze cv gleich kf.
Passe logreg_cv an die Trainingsdaten an.
Drucke die besten Parameter und die Korrektklassifikationsrate des Modells.

script.py

IPython Shell

Klassifikation

Regression

Feinabstimmung deines Modells

Vorverarbeitung und Pipelines

Übung

Übung

Hyperparameter-Tuning mit RandomizedSearchCV

Anweisungen