1. Learn
  2. /
  3. Cursuri
  4. /
  5. Reducerea dimensionalității în R

Connected

exercițiu

Creează o rețetă pentru varianță redusă

Pachetul tidymodels oferă o modalitate mai bună de a filtra caracteristicile cu varianță zero sau aproape zero, prin funcțiile step_zv() și, respectiv, step_nzv(). Acești pași de rețetă identifică caracteristicile cu varianță redusă examinând numărul de valori unice și raportul dintre frecvența celor mai comune valori din fiecare caracteristică. Această abordare este mai robustă decât pragul simplu de varianță folosit anterior.

În plus, vei folosi pasul de rețetă step_scale() pentru a normaliza varianța caracteristicilor. Ține minte că este întotdeauna o idee bună să normalizezi datele, astfel încât varianțele să fie comparabile între caracteristici.

Setul de date house_sales_df este disponibil pentru a fi utilizat. Variabila țintă este price. Pachetele tidyverse și tidymodels au fost deja încărcate.

Instrucțiuni

100 XP
  • Definește o rețetă pentru un filtru de varianță redusă și pregătește-o folosind house_sales_df.
  • Aplică rețeta pe house_sales_df și stochează datele filtrate în filtered_house_sales_df.
  • Afișează caracteristicile pe care rețeta le-a filtrat în pasul step_nzv().