1. Učit se
  2. /
  3. Kurzy
  4. /
  5. Supervised Learning with scikit-learn

Connected

cvičení

Centrování a škálování pro regresi

Teď, když znáš výhody škálování dat, použiješ pipeline k předzpracování příznaků z music_df a sestavíš model lasso regrese pro předpovídání hlasitosti skladby.

Z datasetu music_df byly vytvořeny X_train, X_test, y_train a y_test, kde cílová proměnná je "loudness" a příznaky tvoří všechny ostatní sloupce datasetu. Lasso a Pipeline jsou již naimportované.

Povšimni si, že "genre" byl převeden na binární příznak, kde 1 označuje rockovou skladbu a 0 představuje ostatní žánry.

Pokyny

100 XP
  • Importuj StandardScaler.
  • Vytvoř kroky pro objekt pipeline: objekt StandardScaler pojmenovaný "scaler" a lasso model pojmenovaný "lasso" s hodnotou alpha nastavenou na 0.5.
  • Vytvoř instanci pipeline s kroky pro škálování a sestavení modelu lasso regrese.
  • Vypočítej hodnotu R-squared na testovacích datech.