1. Learn
  2. /
  3. Cursuri
  4. /
  5. Reducerea dimensionalității în R

Connected

exercițiu

Scalează datele pentru regresia lasso

Pentru a pregăti ajustarea unui model de regresie lasso, este important să scalezi datele, astfel încât toate caracteristicile să fie comparabile între ele. Setul complet de date privind vânzările de locuințe din King County, California, este disponibil în house_sales_df.

În acest exercițiu, vei scala variabila țintă, price, separat, înainte de a împărți datele în seturi de antrenament și de testare. Acest lucru este necesar datorită modului în care funcționează rețetele din tidymodels — transformările variabilei țintă nu se includ în rețetă.

Pachetele tidyverse și tidymodels au fost deja încărcate.

Instrucțiuni

100 XP
  • Scalează variabila țintă price din house_sales_df folosind scale().
  • Creează seturile de antrenament și de testare, cu 80% din date în setul de antrenament.
  • Creează rețeta folosind datele de antrenament pentru a scala toți predictorii numerici.