1. Nauka
  2. /
  3. Kursy
  4. /
  5. Nadzorowane uczenie maszynowe z scikit-learn

Connected

ćwiczenie

Centrowanie i skalowanie w regresji

Skoro znasz już zalety skalowania danych, użyjesz potoku, aby przetworzyć cechy ze zbioru music_df i zbudować model regresji lasso do przewidywania głośności utworu.

Zbiory X_train, X_test, y_train i y_test zostały utworzone na podstawie zbioru danych music_df, gdzie zmienną docelową jest "loudness", a cechami są wszystkie pozostałe kolumny. Lasso i Pipeline zostały już zaimportowane.

Zwróć uwagę, że kolumna "genre" została przekształcona na cechę binarną, gdzie 1 oznacza utwór rockowy, a 0 reprezentuje pozostałe gatunki.

Instrukcje

100 XP
  • Zaimportuj StandardScaler.
  • Utwórz kroki potoku: obiekt StandardScaler o nazwie "scaler" oraz model lasso o nazwie "lasso" z parametrem alpha ustawionym na 0.5.
  • Utwórz instancję potoku z krokami służącymi do skalowania i budowania modelu regresji lasso.
  • Oblicz wartość R-kwadrat na danych testowych.