1. Learn
  2. /
  3. Cursuri
  4. /
  5. Învățare supravegheată cu scikit-learn

Connected

exercițiu

Centrare și scalare pentru regresie

Acum că ai văzut beneficiile scalării datelor, vei folosi un pipeline pentru a preprocesa caracteristicile din setul de date music_df și pentru a construi un model de regresie lasso care să prezică intensitatea sonoră a unui cântec.

X_train, X_test, y_train și y_test au fost create din setul de date music_df, unde variabila țintă este "loudness", iar caracteristicile sunt toate celelalte coloane din set. Lasso și Pipeline au fost deja importate pentru tine.

Reține că "genre" a fost convertit la o caracteristică binară, unde 1 indică un cântec rock, iar 0 reprezintă alte genuri.

Instrucțiuni

100 XP
  • Importă StandardScaler.
  • Creează pașii pentru obiectul pipeline: un obiect StandardScaler numit "scaler" și un model lasso numit "lasso" cu alpha setat la 0.5.
  • Instanțiază un pipeline cu pașii necesari pentru a scala datele și a construi un model de regresie lasso.
  • Calculează valoarea R-pătrat pe datele de testare.