Ajustarea hiperparametrilor cu RandomizedSearchCV

Așa cum ai văzut, GridSearchCV poate fi costisitor din punct de vedere computațional, mai ales atunci când explorezi un spațiu mare de hiperparametri. În acest caz, poți folosi RandomizedSearchCV, care testează un număr fix de combinații de hiperparametri, selectate din distribuții de probabilitate specificate.

Seturile de antrenament și de testare din diabetes_df au fost preîncărcate ca X_train, X_test, y_train și y_test, unde variabila țintă este "diabetes". Un model de regresie logistică a fost creat și stocat ca logreg, iar o variabilă KFold a fost stocată ca kf.

Vei defini un interval de hiperparametri și vei folosi RandomizedSearchCV, importat din sklearn.model_selection, pentru a găsi hiperparametrii optimi din aceste opțiuni.

Creează params, adăugând "l1" și "l2" ca valori pentru penalty, setând C la un interval de 50 de valori float între 0.1 și 1.0, și class_weight fie la "balanced", fie la un dicționar care conține 0:0.8, 1:0.2.
Creează obiectul Randomized Search CV, transmițând modelul și parametrii, și setând cv egal cu kf.
Antrenează logreg_cv pe datele de antrenament.
Afișează cei mai buni parametri și scorul de acuratețe ale modelului.

exercițiu

Ajustarea hiperparametrilor cu RandomizedSearchCV

Instrucțiuni

.css-6su6fj{-webkit-flex-shrink:0;-ms-flex-negative:0;flex-shrink:0;}exercițiu

Instrucțiuni

exercițiu