Aan de slagGa gratis aan de slag

Maak een low-variance-filter

In deze oefening krijg je house_sales_df, met zeventien continue features. Sommige van die features hebben helemaal geen variantie. Andere hebben heel weinig variantie. Je gaat de varianties verkennen en een filter opstellen met een passende variantiedrempel. Deze aanpak is handig om dimensies met weinig tot geen informatie te reduceren, maar zoals je zult zien, heeft dit een paar nadelen.

De pakketten tidyverse en tidymodels zijn alvast voor je geladen.

Deze oefening maakt deel uit van de cursus

Dimensionality Reduction in R

Cursus bekijken

Praktische interactieve oefening

Probeer deze oefening eens door deze voorbeeldcode in te vullen.

# Calculate feature variances
houses_sales_variances <- ___ %>% 
  summarize(across(everything(), ~ ___(___(., ___ = ___), na.rm = ___))) %>% 
  pivot_longer(everything(), names_to = "feature", values_to = "variance") %>% 
  ___(desc(___))

houses_sales_variances
Code bewerken en uitvoeren