Centrowanie i skalowanie w regresji

Skoro znasz już zalety skalowania danych, użyjesz potoku, aby przetworzyć cechy ze zbioru music_df i zbudować model regresji lasso do przewidywania głośności utworu.

Zbiory X_train, X_test, y_train i y_test zostały utworzone na podstawie zbioru danych music_df, gdzie zmienną docelową jest "loudness", a cechami są wszystkie pozostałe kolumny. Lasso i Pipeline zostały już zaimportowane.

Zwróć uwagę, że kolumna "genre" została przekształcona na cechę binarną, gdzie 1 oznacza utwór rockowy, a 0 reprezentuje pozostałe gatunki.

Zaimportuj StandardScaler.
Utwórz kroki potoku: obiekt StandardScaler o nazwie "scaler" oraz model lasso o nazwie "lasso" z parametrem alpha ustawionym na 0.5.
Utwórz instancję potoku z krokami służącymi do skalowania i budowania modelu regresji lasso.
Oblicz wartość R-kwadrat na danych testowych.

ćwiczenie

Centrowanie i skalowanie w regresji

Instrukcje

.css-6su6fj{-webkit-flex-shrink:0;-ms-flex-negative:0;flex-shrink:0;}ćwiczenie

Instrukcje

ćwiczenie