1. Nauka
  2. /
  3. Kursy
  4. /
  5. Nadzorowane uczenie maszynowe z scikit-learn

Connected

ćwiczenie

Skalowanie i centrowanie w klasyfikacji

Teraz połączysz skalowanie i budowanie modelu w jeden potok do walidacji krzyżowej.

Twoim zadaniem jest zbudowanie potoku, który skaluje cechy w zbiorze danych music_df i przeprowadza walidację krzyżową z przeszukiwaniem siatki, używając modelu regresji logistycznej z różnymi wartościami hiperparametru C. Zmienna docelowa to "genre" – zawiera wartości binarne: 1 dla rocka i 0 dla każdego innego gatunku.

Klasy StandardScaler, LogisticRegression i GridSearchCV są już zaimportowane.

Instrukcje

100 XP
  • Zdefiniuj kroki potoku: obiekt StandardScaler() o nazwie "scaler" oraz model regresji logistycznej o nazwie "logreg".
  • Utwórz słownik parameters, przeszukując 20 równomiernie rozłożonych wartości zmiennoprzecinkowych z zakresu od 0.001 do 1.0 dla hiperparametru C modelu regresji logistycznej w ramach potoku.
  • Utwórz instancję obiektu przeszukiwania siatki.
  • Dopasuj obiekt przeszukiwania siatki do danych treningowych.